A GPU NVIDIA A100, que servirá no campo da computação de alto desempenho, foi a primeira GPU baseada na produção de 7nm.
NVIDIA apresenta a primeira GPU de classe HPC de 7nm Ampere
A NVIDIA levantou as cortinas de sua GPU mais poderosa baseada na tecnologia de fabricação de 7 nm e na arquitetura Ampere. O chip, chamado GA100, é a maior GPU de 7 nm já projetada usando a nova arquitetura Ampere. Este produto foi produzido inteiramente para o mercado de HPC para ser usado em aplicações como pesquisa científica, inteligência artificial e aprendizado profundo.
Em primeiro lugar, a GPU NVIDIA Ampere GA100 estará disponível em vários formatos. Quando chegamos às especificações técnicas básicas, podemos dizer que o GA100 é uma fera. Com um die size de 826mm², este chip possui 54,2 bilhões de transistores. Em seu antecessor, esse valor era de 21,1 bilhões.
Com 8192 núcleos CUDA e 128 SMs, o NVIDIA Ampere GA100 é o lar da maior contagem de núcleo único de GPU que já vimos. Como resultado, vemos que ele vem com 8192 núcleos FP32, 4096 núcleos FP64 e 512 núcleos tensores. A GPU possui 8 clusters de processamento gráfico, cada um com 16 unidades SM e 8 TPCs. O GA100 com enormes recursos tem um TDP de 400W.
O chip A100 tem até 128 SMs e 8192 núcleos FP32 CUDA, mas apenas 108 SMs serão habilitados na versão inicial.
Ao redor da enorme GPU estão seis pilhas de memória HBM2 (8 GB por memória), fornecendo uma capacidade total de memória de 48 GB. No entanto, diz-se que os produtos com 5 pilhas de memória (40 GB) serão enviados em primeiro lugar. Também é afirmado que a memória funciona a velocidades de 2,0 Gbps e atingirá uma largura de banda de cerca de 1,6 Tbps.
Recursos e comparação do GA100
GPU | NVIDIA Tesla P100 | NVIDIA Tesla V100 | NVIDIA A100 |
Nome de código da GPU | GP100 | GV100 | GA100 |
Arquitetura da GPU | NVIDIA Pascal | NVIDIA Volta | NVIDIA Ampère |
Fator de forma da GPU | SXM | SXM2 | SXM4 |
SM | 56 | 80 | 108 (128) |
TPC | 28 | 40 | 54 (64) |
Núcleo FP32 | 3584 | 5120 | 6912 (8192) |
Núcleo FP64 | 1792 | 2560 | 3456 (4096) |
Núcleo INT32 | – | 5120 | 6912 (8192) |
Núcleo tensor | – | 640 | 432 (512) |
Relógio de impulso da GPU | 1480MHz | 1530MHz | 1410MHz |
Unidades de textura | 224 | 320 | 432 |
Interface de memória | HBM2 de 4096 bits | HBM2 de 4096 bits | HBM2 de 5120 bits |
Tamanho da memória | 16 GB | 32 GB / 16 GB | 40 GB (48 GB) |
Taxa de dados de memória | 703MHz DDR | DDR de 877,5 MHz | 1215MHz DDR |
Largura de banda de memória | 720 GB/segundo | 900 GB/segundo | 1,6 TB/segundo |
Cache L2 | 4096 KB | 6144 KB | 40960 KB |
Tamanho da Memória Compartilhada / SM | 64 KB | até 96 KB | até 164 KB |
Número de Transistores | 15,3 bilhões | 21,1 bilhões | 54,2 bilhões |
Tamanho da matriz da GPU | 610 mm² | 815 mm² | 826 mm² |
Tecnologia de Produção TSMC | 16nm FinFET+ | 12nm FFN | 7 nm N7 |
TDP | 300W | 300W | 400W |
Deja una respuesta