Ранее в этом месяце мы сообщали, что китайская компания Birentech работает над своим самым быстрым на сегодняшний день графическим процессором Biren BR100. Основываясь на том, что компания публично сообщила, Biren BR100 стремится стать графическим процессором общего назначения, который будет обеспечивать более высокую производительность, чем графические процессоры NVIDIA A100 в обработке ИИ. Теперь на Hot Chips 34 компания представляет нам более подробную информацию о спецификациях и архитектуре своей линейки Biren GPGPU. Birentech BR100 — это флагманский графический процессор общего назначения, который может предложить Китай, с собственной архитектурой графического процессора, использующей 7-нм технологический узел и вмещающей 77 миллиардов транзисторов в своем кристалле.
Графический процессор был изготовлен по дизайну TSMC 2.5D CoWoS, а также поставляется с 300 МБ встроенной кэш-памяти, 64 ГБ HBM2e с пропускной способностью памяти 2,3 ТБ/сек и поддержкой PCIe Gen 5.0 (протокол межсоединения CXL). Весь чип имеет площадь 1074 мм2, что превышает предел сетки технологического узла. Говоря о самой архитектуре, Biren BR100 состоит из двух чипсетов, каждый из которых содержит 16 SPC или кластеров потоковой обработки. Каждый SPC имеет 16 EU, и четыре из этих EU образуют внутреннюю вычислительную единицу или CU, которая подключена к 64 КБ кэш-памяти L1 (LSC), в то время как SPC имеет общий кэш L2 объемом 8 МБ для всех исполнительных единиц. Итак, всего 32 SPC с 512 исполнительными модулями, 256 МБ кэш-памяти L2 и 8 МБ кэш-памяти L1.