NVIDIA apresenta a primeira GPU de classe HPC de 7nm Ampere

A GPU NVIDIA A100, que servirá no campo da computação de alto desempenho, foi a primeira GPU baseada na produção de 7nm.

NVIDIA apresenta a primeira GPU de classe HPC de 7nm Ampere

A NVIDIA levantou as cortinas de sua GPU mais poderosa baseada na tecnologia de fabricação de 7 nm e na arquitetura Ampere. O chip, chamado GA100, é a maior GPU de 7 nm já projetada usando a nova arquitetura Ampere. Este produto foi produzido inteiramente para o mercado de HPC para ser usado em aplicações como pesquisa científica, inteligência artificial e aprendizado profundo.

Em primeiro lugar, a GPU NVIDIA Ampere GA100 estará disponível em vários formatos. Quando chegamos às especificações técnicas básicas, podemos dizer que o GA100 é uma fera. Com um die size de 826mm², este chip possui 54,2 bilhões de transistores. Em seu antecessor, esse valor era de 21,1 bilhões.

Com 8192 núcleos CUDA e 128 SMs, o NVIDIA Ampere GA100 é o lar da maior contagem de núcleo único de GPU que já vimos. Como resultado, vemos que ele vem com 8192 núcleos FP32, 4096 núcleos FP64 e 512 núcleos tensores. A GPU possui 8 clusters de processamento gráfico, cada um com 16 unidades SM e 8 TPCs. O GA100 com enormes recursos tem um TDP de 400W.

O chip A100 tem até 128 SMs e 8192 núcleos FP32 CUDA, mas apenas 108 SMs serão habilitados na versão inicial.

Ao redor da enorme GPU estão seis pilhas de memória HBM2 (8 GB por memória), fornecendo uma capacidade total de memória de 48 GB. No entanto, diz-se que os produtos com 5 pilhas de memória (40 GB) serão enviados em primeiro lugar. Também é afirmado que a memória funciona a velocidades de 2,0 Gbps e atingirá uma largura de banda de cerca de 1,6 Tbps.

Recursos e comparação do GA100

GPU NVIDIA Tesla P100 NVIDIA Tesla V100 NVIDIA A100
Nome de código da GPU GP100 GV100 GA100
Arquitetura da GPU NVIDIA Pascal NVIDIA Volta NVIDIA Ampère
Fator de forma da GPU SXM SXM2 SXM4
SM 56 80 108 (128)
TPC 28 40 54 (64)
Núcleo FP32 3584 5120 6912 (8192)
Núcleo FP64 1792 2560 3456 (4096)
Núcleo INT32 5120 6912 (8192)
Núcleo tensor 640 432 (512)
Relógio de impulso da GPU 1480MHz 1530MHz 1410MHz
Unidades de textura 224 320 432
Interface de memória HBM2 de 4096 bits HBM2 de 4096 bits HBM2 de 5120 bits
Tamanho da memória 16 GB 32 GB / 16 GB 40 GB (48 GB)
Taxa de dados de memória 703MHz DDR DDR de 877,5 MHz 1215MHz DDR
Largura de banda de memória 720 GB/segundo 900 GB/segundo 1,6 TB/segundo
Cache L2 4096 KB 6144 KB 40960 KB
Tamanho da Memória Compartilhada / SM 64 KB até 96 KB até 164 KB
Número de Transistores 15,3 bilhões 21,1 bilhões 54,2 bilhões
Tamanho da matriz da GPU 610 mm² 815 mm² 826 mm²
Tecnologia de Produção TSMC 16nm FinFET+ 12nm FFN 7 nm N7
TDP 300W 300W 400W

Notícia

GPU, Memória, Nvidia, MHz, Bilhões, Ampere

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *