AMD Instinct MI200: чипсет с двумя графическими процессорами

AMD объявила о дебюте своей 6-нм архитектуры CDNA2 (Compute-DNA) в виде семейства MI200. Новый ускоритель чиплета с двумя графическими процессорами направлен на то, чтобы вывести AMD в новую эру приложений высокопроизводительных вычислений (HPC), на территорию с высокой маржой, на которой ей необходимо конкурировать для непрерывного устойчивого роста. С этой целью AMD дополнительно улучшила зрелую ориентированную на вычисления архитектуру, рожденную с помощью Graphics Core Next (GCN), и сумела повысить производительность при одновременном уменьшении общего размера кристалла по сравнению с семейством MI100.

Ускоритель AMD MI250X оснащен двумя вычислительными матрицами с 58 миллиардами транзисторов, созданными по 6-нм техпроцессу TSMC. Каждый из этих чипов имеет в общей сложности 110 вычислительных единиц (CU), что в сумме составляет 220 CU на одном ускорителе. Новая архитектура CDNA2 также включает новые улучшенные матричные ядра в количестве 880 единиц (440 на чип). И поскольку MI250X настроен, это невероятное количество мощности графического процессора сочетается с 128 ГБ памяти HBM2E, работающей со скоростью 3,2 ТБ / с. Оценки производительности AMD по сравнению с A100 от NVIDIA текущего поколения неуместны. По сравнению с A100, MI250X оценивается как: в 4,9 раза быстрее при векторных вычислениях FP64; В 2,5 раза быстрее в FP 32 Vector; В 4,9 раза быстрее в FP64 Matrix; более скудная, в 1,2 раза более высокая производительность при операциях с матрицами FP16 и BF16; 1. В 6 раз больше памяти (128 ГБ на MI 250X по сравнению с 80 ГБ в A100); и более высокая пропускная способность памяти в 1,6 раза (хотя это связано с более быстрой памятью HBM2E).

Два кристалла CDNA2 связаны вместе AMD Infinity Fabric, которая дебютирует в графической архитектуре. Этот канал обеспечивает серию каналов со скоростью 25 Гбит / с, обеспечивающих двунаправленную пропускную способность до 100 ГБ / с между обоими графическими процессорами. В модуле распределения MI200 имеется восемь доступных ссылок, созданных в соответствии со спецификациями конфигурации OAM (OCP Accelerator Module, где OCP означает «Открытая вычислительная платформа»). В общей сложности для обмена данными между двумя чиплетами «на лету» доступно 800 ГБ / с. AMD уже объявила, что в будущем будет выпущена версия MI200 с интерфейсом PCIe, предназначенная для тех, кто просто хочет заменить или обновить его.

Использование AMD технологии изготовления TSMC N6, безусловно, частично объясняет улучшение производительности и размера кристалла. Как и любой производитель, AMD прилагает усилия по оптимизации урожайности. Это становится ясно, когда мы смотрим на другой продукт, который AMD представляет вместе с MI250X: ускоритель MI250. MI250 сокращает вычислительные ресурсы, снижая количество CU MI250X со 110 до 104 CU на чиплет. На самом деле это единственное изменение; он должен быть примерно на 5% медленнее, чем полностью включенный MI250X.

В целом, серия MI200 - это заметное улучшение производительности AMD. И все же NVIDIA скоро анонсирует собственное вычислительное решение следующего поколения.
Samsung будет выпускать чипы на подложке из стекла…
Samsung Electronics готовится совершить важный технологический скачок в сфере производства полупроводнико…
Intel готовится потеснить TSMC на рынке чипов…
Полупроводниковый бизнес компании Intel остро нуждается в прорыве — не только по финансовым причинам, но …
AMD больше не сотрудничает с Samsung Foundry…
Судя по информации весьма надёжных инсайдеров, у компании Samsung Foundry продолжаются трудности — по пос…
Huawei уже тестирует ИИ-чип Ascend 910D…
Новый ИИ-чип Huawei Ascend 910D отправился в массовое производство и китайский технологический гигант гот…
Qualcomm готовит Snapdragon X2 Elite на 64 ГБ памяти…
Компания Qualcomm совсем недавно анонсировала проведение мероприятия Snapdragon Summit, которое пройдёт с…
Intel догонит TSMC по технологическому процессу…
На текущий момент многие подразделения Intel показывают не самые впечатляющие результаты, но перспективы …
Intel выпустила патч для процессоров Arrow Lake…
Компания Intel продолжает улучшать производительность своих процессоров поколения Arrow Lake — сегодня он…
Клиентам оказался не очень интересен новый техпроцесс Intel…
В маркетинговом плане производственный техпроцесс Intel 18A считается условным аналогом 2-нм технологии T…
МегаОбзор
ЭЛ № ФС 77 - 68301. Выходные данные СМИ МегаОбзор
2006-2025
© MegaObzor