AMD Instinct MI200: чипсет с двумя графическими процессорами

AMD объявила о дебюте своей 6-нм архитектуры CDNA2 (Compute-DNA) в виде семейства MI200. Новый ускоритель чиплета с двумя графическими процессорами направлен на то, чтобы вывести AMD в новую эру приложений высокопроизводительных вычислений (HPC), на территорию с высокой маржой, на которой ей необходимо конкурировать для непрерывного устойчивого роста. С этой целью AMD дополнительно улучшила зрелую ориентированную на вычисления архитектуру, рожденную с помощью Graphics Core Next (GCN), и сумела повысить производительность при одновременном уменьшении общего размера кристалла по сравнению с семейством MI100.

Ускоритель AMD MI250X оснащен двумя вычислительными матрицами с 58 миллиардами транзисторов, созданными по 6-нм техпроцессу TSMC. Каждый из этих чипов имеет в общей сложности 110 вычислительных единиц (CU), что в сумме составляет 220 CU на одном ускорителе. Новая архитектура CDNA2 также включает новые улучшенные матричные ядра в количестве 880 единиц (440 на чип). И поскольку MI250X настроен, это невероятное количество мощности графического процессора сочетается с 128 ГБ памяти HBM2E, работающей со скоростью 3,2 ТБ / с. Оценки производительности AMD по сравнению с A100 от NVIDIA текущего поколения неуместны. По сравнению с A100, MI250X оценивается как: в 4,9 раза быстрее при векторных вычислениях FP64; В 2,5 раза быстрее в FP 32 Vector; В 4,9 раза быстрее в FP64 Matrix; более скудная, в 1,2 раза более высокая производительность при операциях с матрицами FP16 и BF16; 1. В 6 раз больше памяти (128 ГБ на MI 250X по сравнению с 80 ГБ в A100); и более высокая пропускная способность памяти в 1,6 раза (хотя это связано с более быстрой памятью HBM2E).

Два кристалла CDNA2 связаны вместе AMD Infinity Fabric, которая дебютирует в графической архитектуре. Этот канал обеспечивает серию каналов со скоростью 25 Гбит / с, обеспечивающих двунаправленную пропускную способность до 100 ГБ / с между обоими графическими процессорами. В модуле распределения MI200 имеется восемь доступных ссылок, созданных в соответствии со спецификациями конфигурации OAM (OCP Accelerator Module, где OCP означает «Открытая вычислительная платформа»). В общей сложности для обмена данными между двумя чиплетами «на лету» доступно 800 ГБ / с. AMD уже объявила, что в будущем будет выпущена версия MI200 с интерфейсом PCIe, предназначенная для тех, кто просто хочет заменить или обновить его.

Использование AMD технологии изготовления TSMC N6, безусловно, частично объясняет улучшение производительности и размера кристалла. Как и любой производитель, AMD прилагает усилия по оптимизации урожайности. Это становится ясно, когда мы смотрим на другой продукт, который AMD представляет вместе с MI250X: ускоритель MI250. MI250 сокращает вычислительные ресурсы, снижая количество CU MI250X со 110 до 104 CU на чиплет. На самом деле это единственное изменение; он должен быть примерно на 5% медленнее, чем полностью включенный MI250X.

В целом, серия MI200 - это заметное улучшение производительности AMD. И все же NVIDIA скоро анонсирует собственное вычислительное решение следующего поколения.
Intel представила ускоритель ИИ Gaudi 3…
На протяжении достаточно длительного времени в сети ходили слухи о том, что компания Intel планирует созд…
Intel Xeon W9-3595X активно тестируют перед релизом…
Следующий поколение процессоров Intel Xeon-W, вероятно, уже совсем скоро отправится в релиз, потому что м…
Intel Core i9-14900KS будут продавать за 750 долларов…
Если верить информации из сети, процессор Intel Core i9-14900KS должен отправиться в релиз в самое ближай…
Google представила процессор Axion для ЦОД…
Сегодня компания Google официально объявила о релизе своего первого процессора на базе архитектуры Arm дл…
Qualcomm Snapdragon X Elite демонстрирует прирост производит…
Некоторое время назад мобильный процессор Qualcomm Snapdragon X Elite прошёл целый цикл тестов в составе …
TSMC за январь 2024 года заработала 7 млрд долларов…
Если верить официальному отчёту, выручка компании TSMC только за январь 2024 года составляет 215 миллиард…
Китайский процессор Zhaoxin KX-7000 протестировали в бенчмар…
Китайский процессор Zhaoxin KX-7000, который был разработан локально в Китае для собственного рынка элект…
Intel снимает с производства процессоры Raptor Lake-S…
Сегодня компания Intel официально сообщила о своих планах по прекращению выпуска настольных процессоров …
МегаОбзор
ЭЛ № ФС 77 - 68301. Выходные данные СМИ МегаОбзор
2006-2024
© MegaObzor