AMD Instinct MI200: чипсет с двумя графическими процессорами

AMD объявила о дебюте своей 6-нм архитектуры CDNA2 (Compute-DNA) в виде семейства MI200. Новый ускоритель чиплета с двумя графическими процессорами направлен на то, чтобы вывести AMD в новую эру приложений высокопроизводительных вычислений (HPC), на территорию с высокой маржой, на которой ей необходимо конкурировать для непрерывного устойчивого роста. С этой целью AMD дополнительно улучшила зрелую ориентированную на вычисления архитектуру, рожденную с помощью Graphics Core Next (GCN), и сумела повысить производительность при одновременном уменьшении общего размера кристалла по сравнению с семейством MI100.

Ускоритель AMD MI250X оснащен двумя вычислительными матрицами с 58 миллиардами транзисторов, созданными по 6-нм техпроцессу TSMC. Каждый из этих чипов имеет в общей сложности 110 вычислительных единиц (CU), что в сумме составляет 220 CU на одном ускорителе. Новая архитектура CDNA2 также включает новые улучшенные матричные ядра в количестве 880 единиц (440 на чип). И поскольку MI250X настроен, это невероятное количество мощности графического процессора сочетается с 128 ГБ памяти HBM2E, работающей со скоростью 3,2 ТБ / с. Оценки производительности AMD по сравнению с A100 от NVIDIA текущего поколения неуместны. По сравнению с A100, MI250X оценивается как: в 4,9 раза быстрее при векторных вычислениях FP64; В 2,5 раза быстрее в FP 32 Vector; В 4,9 раза быстрее в FP64 Matrix; более скудная, в 1,2 раза более высокая производительность при операциях с матрицами FP16 и BF16; 1. В 6 раз больше памяти (128 ГБ на MI 250X по сравнению с 80 ГБ в A100); и более высокая пропускная способность памяти в 1,6 раза (хотя это связано с более быстрой памятью HBM2E).

Два кристалла CDNA2 связаны вместе AMD Infinity Fabric, которая дебютирует в графической архитектуре. Этот канал обеспечивает серию каналов со скоростью 25 Гбит / с, обеспечивающих двунаправленную пропускную способность до 100 ГБ / с между обоими графическими процессорами. В модуле распределения MI200 имеется восемь доступных ссылок, созданных в соответствии со спецификациями конфигурации OAM (OCP Accelerator Module, где OCP означает «Открытая вычислительная платформа»). В общей сложности для обмена данными между двумя чиплетами «на лету» доступно 800 ГБ / с. AMD уже объявила, что в будущем будет выпущена версия MI200 с интерфейсом PCIe, предназначенная для тех, кто просто хочет заменить или обновить его.

Использование AMD технологии изготовления TSMC N6, безусловно, частично объясняет улучшение производительности и размера кристалла. Как и любой производитель, AMD прилагает усилия по оптимизации урожайности. Это становится ясно, когда мы смотрим на другой продукт, который AMD представляет вместе с MI250X: ускоритель MI250. MI250 сокращает вычислительные ресурсы, снижая количество CU MI250X со 110 до 104 CU на чиплет. На самом деле это единственное изменение; он должен быть примерно на 5% медленнее, чем полностью включенный MI250X.

В целом, серия MI200 - это заметное улучшение производительности AMD. И все же NVIDIA скоро анонсирует собственное вычислительное решение следующего поколения.
Intel выпустила Xe Super Sampling третьего поколения…
Вчера Intel выпустила свежие драйверы для видеокарт Arc, и главным нововведением стало внедрение технолог…
Intel будет выпускать процессоры для Apple…
Intel Foundry, судя по всему, близка к прорыву со своим техпроцессом 18A-P — известный аналитик прогнозир…
Qualcomm Snapdragon X Elite может работать на 40 Вт…
Преемник Snapdragon X Elite был представлен в конце сентября, а теперь Qualcomm раскрыла дополнительные п…
Процессоры Intel Nova Lake будут поддерживать AVX10…
Официальная документация подтвердила, что процессоры следующего поколения Intel Nova Lake получат поддерж…
Intel отказалась от активации функций процессоров по подписк…
Компания Intel фактически свернула инициативу Software Defined Silicon, также известную как Intel On Dema…
Новые процессоры AMD будут поддерживать LPDDR6…
До следующего крупного обновления гибридных процессоров AMD Ryzen AI MAX ещё далеко, однако картина вокру…
Steam Machine будет заметно дороже консолей…
В свежем выпуске подкаста WAN Show от Linus Tech Tips Линус прокомментировал ещё не раскрытую стоимость S…
Intel Core Ultra 5 250K Plus засветился в бенчмарке с 18 ядр…
Грядущий десктопный процессор Intel Core Ultra 5 250K Plus засветился в базе данных Geekbench — этот проц…
МегаОбзор
ЭЛ № ФС 77 - 68301. Выходные данные СМИ МегаОбзор
2006-2026
© MegaObzor