Новый стартап Inflection AI, основанный бывшим руководителем компании DeepMind и поддерживаемый компаниями Microsoft и NVIDIA, на прошлой неделе привлек 1,3 миллиарда долларов инвестиций от крупных игроков индустрии. Компания планирует использовать собранные средства для создания кластера суперкомпьютеров, оснащённых до 22 000 вычислительными блоками NVIDIA H100. Этот кластер, в теории, будет обладать пиковой вычислительной мощностью, сопоставимой с суперкомпьютером Frontier. Кластер, работающий на 22 000 вычислительных видеокартах NVIDIA H100, теоретически способен достигнуть производительности 1,474 эксафлопс в формате FP64 с использованием Tensor-ядер. При выполнении общего кода FP64 на CUDA-ядрах пиковая пропускная способность уменьшается в два раза и составляет 0,737 эксафлопс.
В то же время самый быстрый суперкомпьютер мира Frontier имеет пиковую вычислительную производительность 1,813 эксафлопс в формате FP64 (удвоенную до 3.626 эксафлопс для операций с матрицами). Таким образом, планируемый новый компьютер займёт лишь второе место, хотя после запуска новых компьютеров он вполне может опуститься и ниже. Хотя производительность FP64 важна для многих научных задач, этот компьютер, скорее всего, будет намного быстрее для задач, связанных с искусственным интеллектом. Пиковая производительность FP16/BF16 составляет 43,5 эксафлопс и именно в этом режиме компьютер вполне способен предоставить просто безумную производительность.