O que é um núcleo de tensor? A tecnologia NVIDIA GPU explicou

Se você já se perguntou o que é um núcleo de tensor, não está sozinho. Se você está no mercado para uma nova placa de gráfico ou deseja entender seu Carta gráfica da Nvidia Melhor, a tecnologia é essencial para alimentar os jogos exigentes de hoje.

Núcleos tensores podem ser encontrados dentro de todos os Melhores placas gráficas e o Melhores placas gráficas 4Kcomo essa é a tecnologia que utiliza o que é conhecido como computação mista, uma combinação de acionamento algoritmicamente acionado (ou alimentado com IA) e hardware nativo para produzir resultados que excedam em muito a rasterização padrão, permitindo quadramerados mais altos em resoluções mais altas.

Em suma, os núcleos de tensoras são o hardware que alimenta a tecnologia de upscaling da AI da Nvidia, conhecida como DLSS (Super Sampling Deep Learning). Mas como eles funcionam? Além disso, quão importantes são para jogos de PC e tarefas intensivas de produtividade? É isso que o TechRadar está aqui para responder.

O que é um núcleo de tensor?

Os núcleos de tensores são unidades de hardware especialmente desenvolvidas dentro de uma placa gráfica da Nvidia que permite a computação de precisão mista, acelerando as cargas de trabalho de AI de aprendizado profundo e são treinadas em uma vasta rede neural.

Eles são muito mais eficientes em termos de energia do que os núcleos CUDA da sua placa gráfica e são capazes de lidar com operações de precisão mista que, de outra forma, levariam consideravelmente mais tempo para serem concluídas.

História dos núcleos tensores

A Nvidia usou os núcleos de tensores pela primeira vez em sua linha de data centers Volta em 2017, que posteriormente foram expandidos para placas gráficas. As primeiras GPUs a usar os núcleos de tensor foram os Nvidia Titan V, Nvidia Quadro GB100 e a edição do Nvidia Titan V CEO, que utilizaram 640 núcleos de primeira geração de tensor para acelerar suas cargas de IA limitadas ao FP16 (ou um flutuante de 16 bits de 16 bits apontar).

Os núcleos de tensor de segunda geração foram lançados dentro das placas gráficas Turing (RTX 20 Series), que expandiram bastante as precisões até INT1, INT4 e INT8, bem como FP16. As GPUs Turing também foram as primeiras a utilizar núcleos de rastreamento de raios (núcleos de RT), o que tornou possível a técnica de raios em tempo real nos videogames (a combinação da tecnologia mais tarde seria conhecida como ter “RTX on”).

Para uso da produtividade, esses núcleos de tensoras mais rápidos e versáteis foram encontrados dentro de placas de vídeo quadro RTX, usadas principalmente em estações de trabalho para CAD, criação de conteúdo, cálculos científicos e aprendizado de máquina.

Os núcleos de tensor de terceira geração foram construídos dentro das placas gráficas Ampere (RTX 30 Series). Além de INT1, INT4, INT8 e F16, os recursos computacionais foram expandidos para incluir também as precisões TF32, FP64 e BFLOAT16. Esses novos formatos melhoraram bastante os tipos de aprendizado de máquina (e aprendizado profundo), com o formato TF32 sendo até 20x mais rápido que os modelos anteriores de aprendizado misto.

Esses núcleos tensores também foram essenciais para impulsionar o Nvidia DLSS 2.0 à medida que o anti-aliasing temporal (TAA) acelerado por AI-i-i-i-i-i-i-i-i-i-i-i-mais amplamente adotado. Embora a primeira versão do DLSS, lançada em fevereiro de 2019, possa estar embaçada e imprecisa, a quantidade mais ampla de precisões possíveis através dessa geração de núcleos de tensor significava quadragens muito mais altas com software intensivo em hardware, como jogos com raio, particularmente em Resoluções mais altas, como 1440p e 4k.

À medida que a Nvidia passava de uma empresa de computação/hardware para um desenvolvedor de software de IA, uma tendência semelhante pode ser vista com os núcleos de tensor de quarta geração. O uso primário de tecnologias aceleradas de IA é a IA generativa, modelos de idiomas grandes, chatbots e processamento de linguagem natural (PNL).

No entanto, em termos de jogos, os núcleos de tensor de quarta geração também tornaram a geração de quadros do DLSS uma possibilidade, algo que se tornou exclusivo das placas de gráficos ADA (RTX 40 Series) e não foi suportado nas gerações anteriores da GPU RTX. Desde que os desenvolvedores trabalhassem com a Nvidia para ajustar um algoritmo específico baseado em hardware para seus jogos, essas análises técnicas e depois gera quadros adicionais ao lado da rasterização tradicional acontecendo naturalmente. Isso resulta em quadros mais altos, embora seja muito debatido se esses são “quadros reais” ou não.

Utilização do núcleo tensor

Isso nos leva a 2025, com a recente introdução de placas gráficas da Blackwell Architecture com núcleos de tensor de quinta geração. Nvidia.com/en-gb/data-center/tensor-cores/” data-url=”https://www.Nvidia.com/en-gb/data-center/tensor-cores/” target=”_blank” referrerpolicy=”no-referrer-when-downgrade” data-hl-processed=”none”>Nvidia declarou Sua mais recente tecnologia arquitetônica “entrega 30x aceleração” quando comparada à sua geração anterior devido aos novos formatos de precisão suportados.

Para os jogos, esse avanço torna a geração de molduras multi uma possibilidade, que é um recurso exclusivo da RTX 50 Series Graphics Cards (como o RTX 5090 e RTX 5080). Ficamos constantemente impressionados com o que o MFG pode fazer por 8k jogos.

Os núcleos de tensoros funcionam ao lado de núcleos CUDA em jogos (software de IA em conjunto com hardware) para renderizar videogames em uma resolução nativa mais baixa e depois aumentar a escala em uma maior. É assim que as placas gráficas RTX podem produzir quadragens jogáveis ​​de 60 ou mais em resoluções como 4K e 8K enquanto utilizam técnicas de renderização intensivas em hardware, como o rastreamento de raios.

Como o DLSS (e outras tecnologias de RTX) foram continuamente melhoradas ao longo dos anos, as coisas agora parecem o mais próximo possível do desempenho nativo, algo que foi favorecido por muitos jogadores.

Como funcionam os núcleos tensores?

Os núcleos tensores são unidades de hardware especificamente projetadas encontradas nas placas gráficas da Nvidia principalmente para acelerar as cargas de trabalho de IA, como a multiplicação da matriz, que possibilitam o aprendizado da máquina/profundo. À medida que a tecnologia se tornou mais sofisticada de 2017 a 2025, com o lançamento da primeira geração até as ofertas atuais de quinta geração, elas agora facilitam o desempenho significativamente mais rápido quando comparado ao que é possível dos núcleos regulares da GPU.

A principal característica dos núcleos tensores é a computação de precisão mista para executar cálculos com dados de menor precisão com maior precisão do que antes. À medida que a tecnologia amadureceu, os tipos de saída de alta precisão se aprofundaram significativamente.

Além disso, os núcleos tensores são otimizados para operações de acumulação de multiplicação de matriz (resolvendo equações matemáticas complicadas) por meio de seu processamento baseado em ladrilhos. Esses ladrilhos são empilhados, o que significa cálculos paralelos (em vez de lineares) podem ocorrer por núcleo, resultando em cargas de trabalho gerais mais rápidas.

As operações dos núcleos tensoras podem ser divididas em três etapas distintas: carregamento de dados, cálculos de precisão mista e, em seguida, a saída por acumulação.

Tudo isso se reúne para cumprir o que é conhecido como aceleração da IA, que tem uma infinidade de usos nos jogos (DLSS, geração de quadros, MFG e reconstrução de raios) para o treinamento de redes neurais, aprendizado de máquina, aprendizado profundo e linguagem grande modelos.

antonio-cesar-150x150
António César de Andrade

Apaixonado por tecnologia e inovação, traz notícias do seguimento que atua com paixão há mais de 15 anos.