AMD Instinct MI200: чипсет с двумя графическими процессорами

AMD объявила о дебюте своей 6-нм архитектуры CDNA2 (Compute-DNA) в виде семейства MI200. Новый ускоритель чиплета с двумя графическими процессорами направлен на то, чтобы вывести AMD в новую эру приложений высокопроизводительных вычислений (HPC), на территорию с высокой маржой, на которой ей необходимо конкурировать для непрерывного устойчивого роста. С этой целью AMD дополнительно улучшила зрелую ориентированную на вычисления архитектуру, рожденную с помощью Graphics Core Next (GCN), и сумела повысить производительность при одновременном уменьшении общего размера кристалла по сравнению с семейством MI100.

Ускоритель AMD MI250X оснащен двумя вычислительными матрицами с 58 миллиардами транзисторов, созданными по 6-нм техпроцессу TSMC. Каждый из этих чипов имеет в общей сложности 110 вычислительных единиц (CU), что в сумме составляет 220 CU на одном ускорителе. Новая архитектура CDNA2 также включает новые улучшенные матричные ядра в количестве 880 единиц (440 на чип). И поскольку MI250X настроен, это невероятное количество мощности графического процессора сочетается с 128 ГБ памяти HBM2E, работающей со скоростью 3,2 ТБ / с. Оценки производительности AMD по сравнению с A100 от NVIDIA текущего поколения неуместны. По сравнению с A100, MI250X оценивается как: в 4,9 раза быстрее при векторных вычислениях FP64; В 2,5 раза быстрее в FP 32 Vector; В 4,9 раза быстрее в FP64 Matrix; более скудная, в 1,2 раза более высокая производительность при операциях с матрицами FP16 и BF16; 1. В 6 раз больше памяти (128 ГБ на MI 250X по сравнению с 80 ГБ в A100); и более высокая пропускная способность памяти в 1,6 раза (хотя это связано с более быстрой памятью HBM2E).

Два кристалла CDNA2 связаны вместе AMD Infinity Fabric, которая дебютирует в графической архитектуре. Этот канал обеспечивает серию каналов со скоростью 25 Гбит / с, обеспечивающих двунаправленную пропускную способность до 100 ГБ / с между обоими графическими процессорами. В модуле распределения MI200 имеется восемь доступных ссылок, созданных в соответствии со спецификациями конфигурации OAM (OCP Accelerator Module, где OCP означает «Открытая вычислительная платформа»). В общей сложности для обмена данными между двумя чиплетами «на лету» доступно 800 ГБ / с. AMD уже объявила, что в будущем будет выпущена версия MI200 с интерфейсом PCIe, предназначенная для тех, кто просто хочет заменить или обновить его.

Использование AMD технологии изготовления TSMC N6, безусловно, частично объясняет улучшение производительности и размера кристалла. Как и любой производитель, AMD прилагает усилия по оптимизации урожайности. Это становится ясно, когда мы смотрим на другой продукт, который AMD представляет вместе с MI250X: ускоритель MI250. MI250 сокращает вычислительные ресурсы, снижая количество CU MI250X со 110 до 104 CU на чиплет. На самом деле это единственное изменение; он должен быть примерно на 5% медленнее, чем полностью включенный MI250X.

В целом, серия MI200 - это заметное улучшение производительности AMD. И все же NVIDIA скоро анонсирует собственное вычислительное решение следующего поколения.
Qualcomm Snapdragon X Plus показали партнёрам Microsoft…
На текущий момент процессор Snapdragon X Elite является единственным ARM-процессором от компании Qualcomm…
Qualcomm Snapdragon X Elite опередил Intel Core Ultra 7 155H…
Передовой процессор Qualcomm Snapdragon X Elite предназначен для использования в ноутбуках нового поколен…
TSMC за январь 2024 года заработала 7 млрд долларов…
Если верить официальному отчёту, выручка компании TSMC только за январь 2024 года составляет 215 миллиард…
Loongson 3C6000 создали специально для серверов…
Компания Loongson, производитель процессоров из Китая, сообщил об успешном завершении разработки своего п…
Qualcomm Snapdragon X Elite демонстрирует прирост производит…
Некоторое время назад мобильный процессор Qualcomm Snapdragon X Elite прошёл целый цикл тестов в составе …
AMD Radeon 780M разогнали на 60%…
Процессоры AMD Ryzen 8000G оснащены самым производительным в мире встроенным графическим процессором, но …
Intel представила процессор Core i9-14900KS…
Вчера компания Intel официально представила новый процессор Core i9-14900KS, самый производительный проце…
Китайский процессор Zhaoxin KX-7000 протестировали в бенчмар…
Китайский процессор Zhaoxin KX-7000, который был разработан локально в Китае для собственного рынка элект…
МегаОбзор
ЭЛ № ФС 77 - 68301. Выходные данные СМИ МегаОбзор
Яндекс.Метрика
2006-2024
© MegaObzor