AMD Instinct MI200: чипсет с двумя графическими процессорами

AMD объявила о дебюте своей 6-нм архитектуры CDNA2 (Compute-DNA) в виде семейства MI200. Новый ускоритель чиплета с двумя графическими процессорами направлен на то, чтобы вывести AMD в новую эру приложений высокопроизводительных вычислений (HPC), на территорию с высокой маржой, на которой ей необходимо конкурировать для непрерывного устойчивого роста. С этой целью AMD дополнительно улучшила зрелую ориентированную на вычисления архитектуру, рожденную с помощью Graphics Core Next (GCN), и сумела повысить производительность при одновременном уменьшении общего размера кристалла по сравнению с семейством MI100.

Ускоритель AMD MI250X оснащен двумя вычислительными матрицами с 58 миллиардами транзисторов, созданными по 6-нм техпроцессу TSMC. Каждый из этих чипов имеет в общей сложности 110 вычислительных единиц (CU), что в сумме составляет 220 CU на одном ускорителе. Новая архитектура CDNA2 также включает новые улучшенные матричные ядра в количестве 880 единиц (440 на чип). И поскольку MI250X настроен, это невероятное количество мощности графического процессора сочетается с 128 ГБ памяти HBM2E, работающей со скоростью 3,2 ТБ / с. Оценки производительности AMD по сравнению с A100 от NVIDIA текущего поколения неуместны. По сравнению с A100, MI250X оценивается как: в 4,9 раза быстрее при векторных вычислениях FP64; В 2,5 раза быстрее в FP 32 Vector; В 4,9 раза быстрее в FP64 Matrix; более скудная, в 1,2 раза более высокая производительность при операциях с матрицами FP16 и BF16; 1. В 6 раз больше памяти (128 ГБ на MI 250X по сравнению с 80 ГБ в A100); и более высокая пропускная способность памяти в 1,6 раза (хотя это связано с более быстрой памятью HBM2E).

Два кристалла CDNA2 связаны вместе AMD Infinity Fabric, которая дебютирует в графической архитектуре. Этот канал обеспечивает серию каналов со скоростью 25 Гбит / с, обеспечивающих двунаправленную пропускную способность до 100 ГБ / с между обоими графическими процессорами. В модуле распределения MI200 имеется восемь доступных ссылок, созданных в соответствии со спецификациями конфигурации OAM (OCP Accelerator Module, где OCP означает «Открытая вычислительная платформа»). В общей сложности для обмена данными между двумя чиплетами «на лету» доступно 800 ГБ / с. AMD уже объявила, что в будущем будет выпущена версия MI200 с интерфейсом PCIe, предназначенная для тех, кто просто хочет заменить или обновить его.

Использование AMD технологии изготовления TSMC N6, безусловно, частично объясняет улучшение производительности и размера кристалла. Как и любой производитель, AMD прилагает усилия по оптимизации урожайности. Это становится ясно, когда мы смотрим на другой продукт, который AMD представляет вместе с MI250X: ускоритель MI250. MI250 сокращает вычислительные ресурсы, снижая количество CU MI250X со 110 до 104 CU на чиплет. На самом деле это единственное изменение; он должен быть примерно на 5% медленнее, чем полностью включенный MI250X.

В целом, серия MI200 - это заметное улучшение производительности AMD. И все же NVIDIA скоро анонсирует собственное вычислительное решение следующего поколения.
Intel готовит энергоэффективную видеокарту для ИИ…
Похоже, что планы Intel в области искусственного интеллекта включают новый продукт — по данным свежего от…
Intel представит новые процессоры 5 января…
Intel официально объявила, что представит линейку процессоров Panther Lake в первую неделю января — презе…
Китайская Zhaoxin представила мощный процессор KH-50000…
Компания Zhaoxin официально представила серверные процессоры KH-50000, рассчитанные на китайский рынок и …
Apple представила процессор M5…
Сегодня компания Apple представила процессор M5, который, как и его предшественник, использует конфигурац…
Производительность Steam Machine почти на уровне PS5…
Вчера компания Valve представила сразу три новых устройства — Steam Machine, Steam Frame и Steam Controll…
Intel Core Ultra X7 358H засветился в бенчмарках…
Сегодня появились свежие результаты тестирования Core Ultra X7 358H, одного из готовящихся процессоров In…
MediaTek создала первый чип на 2 нм…
16 сентября MediaTek подтвердила, что её первый флагманский процессор на базе 2-нм технологии TSMC успешн…
Qualcomm Snapdragon X Elite может работать на 40 Вт…
Преемник Snapdragon X Elite был представлен в конце сентября, а теперь Qualcomm раскрыла дополнительные п…
МегаОбзор
ЭЛ № ФС 77 - 68301. Выходные данные СМИ МегаОбзор
2006-2025
© MegaObzor