Чип NVIDIA GH100, лежащий в основе вычислительного процессора NVIDIA H100 нового поколения, выглядит колоссально на бумаге, а официальный документ NVIDIA, опубликованный на выходных, раскрывает его ключевые характеристики. NVIDIA использует самый передовой узел производства кремния, доступный в настоящее время от TSMC, для создания вычислительного кристалла, которым является TSMC N4 (EUV класса 4 нм). H100 имеет монолитный кремний, окруженный до шести встроенных стеков HBM3.
Вычислительный кристалл GH100 построен на 4-нм техпроцессе EUV и имеет удивительное количество транзисторов — 80 миллиардов, что почти на 50% больше, чем у GA100. Интересно, однако, что при 814 мм² площадь кристалла GH100 меньше, чем у GA100, а его кристалл площадью 826 мм² построен на 7-нм DUV (TSMC N7) узле, и все благодаря приросту плотности транзисторов 4 нм над 7-нм.
Иерархия компонентов GH100 аналогична архитектуре NVIDIA предыдущего поколения. Основной механизм обработки чисел распределен по 144 потоковым мультипроцессорам (SM). Чип имеет 18 432 ядра FP32 CUDA и 9 216 ядер CUDA двойной точности (FP64). Также имеется 576 ядер Tensor четвертого поколения. Один из GPC на кремнии имеет оборудование для растровой графики, поэтому у кремния есть определенные возможности графического процессора. GH100 оснащен 6144-битным интерфейсом памяти HBM3, а 80 ГБ — это стандартный объем памяти для вычислительного процессора H100. Ожидается, что предлагаемая пропускная способность памяти превысит 3 ТБ/с, включая поддержку ECC. Хост-интерфейсы также получают серьезное обновление. Плата форм-фактора SXM поставляется с межсоединением NVLink последнего поколения с пропускной способностью 900 ГБ/с. Модель форм-фактора AIC имеет PCI-Express 5.0 x16 (128 ГБ/с). Оба интерфейса представляют функции объединения ресурсов. NVIDIA расширяет диапазон мощности в погоне за производительностью: H100 имеет типичное значение мощности 700 Вт по сравнению с 400 Вт у A100.