Сегодня Nvidia стартовала с конференции по технологиям GPU, где генеральный директор Jen-Hsun Huang начал работу над анонсом самого первого графического процессора на основе архитектуры Volta - Tesla V100. Это самый продвинутый ускоритель из когда-либо созданных на базе 5120 ядер CUDA, более 21 миллиарда транзисторов и 16 ГБ HBM2 памяти с производительностью 900 ГБ / с.
GV100 включает в себя 21,1 млрд транзисторов с размером матрицы 815 мм2. Он изготовлен на новом высокопроизводительном производственном процессе TSMC 12nm FFN. В целом, это значительный скачок в производительности вычислений по сравнению с Pascal GP100.
Чтобы улучшить производительность FP31 и FP64, Nvidia оснастила GV100 новой архитектурой SM-процессора. Новый Volta SM на 50 процентов более энергоэффективен, чем Pascal. Кроме того, Volta оснащена новыми «тензорными ядрами», которые разработаны специально для обеспечения до 12 раз более высоких TFLOP для приложений Deep Learning.
Когда дело доходит до памяти, Nvidia решила использовать модули HBM2 от Samsung, в сочетании с контроллером памяти следующего поколения в Volta. Эта комбинация обеспечивает в 1,5 раза большую пропускную способность памяти по сравнению с GP100. Реализация Вольта HBM2 также считается на 95 процентов более эффективной при работе под определенными рабочими нагрузками.
Ниже приведены пиковые вычислительные единицы для Tesla V100:
7.5 TFLOP / с производительности с плавающей точкой двойной точности (FP64);
15 TFLOP / с с одинарной точностью (FP32);
120 Тензор TFLOP / с матрицы смешанной точности умножения и накопления.
И, наконец, вот таблица, идущая по полной спецификации V100 по сравнению с последними поколениями флагманов Tesla.