intel Xeon Scalable «Sapphire Rapids» — это будущий корпоративный процессор с 60 ядрами. Это число ядер достигается с помощью четырех кристаллов, соединенных между собой с помощью EMIB.
Каждый из четырех кристаллов в «Sapphire Rapids» представляет собой полноценный многоядерный процессор сам по себе, в комплекте с ядрами ЦП, интегрированным северным мостом, памятью и интерфейсами PCIe, а также другими платформами ввода-вывода. Что объединяет четыре из них, так это использование пяти мостов EMIB на кристалл.
Это позволяет ядрам ЦП матрицы получать прозрачный доступ к операциям ввода-вывода и памяти, контролируемым любыми другими кристаллами. Логически, «Sapphire Rapids» мало чем отличается от AMD «Naples», которая использует IFOP (Infinity Fabric over package) для соединения четырех 8-ядерных кристаллов «Zeppelin», но усилия здесь, по-видимому, направлены на минимизацию задержки, возникающей из-за внутрикорпусное межсоединение в направлении соединения с высокой пропускной способностью и малой задержкой, в котором используются кремниевые мосты с микроскопическими проводами высокой плотности между ними.
Внутри каждого кристалла схема этажа аналогична нескольким предыдущим поколениям корпоративных процессоров Intel. Intel использует межсоединение Mesh и размещает различные блоки IP в сетке, соединяя их в сеть кольцевых шин. Mesh — это нечто среднее между кольцевой шиной и полной взаимосвязью «точка-точка». Каждый отдельный компонент в сетке называется «плиткой». Кристалл содержит пятнадцать ядер ЦП «Golden Cove», каждое с 2 МБ выделенного кэша L2, и 1,875 МБ фрагмента кэша последнего уровня, который обеспечивает 28 800 КБ (28,125 МБ) кэша L3, который совместно используется всеми 60 ядрами ядра. процессор. Общий кэш L3 для пакета составляет 112,5 МБ.
Каждый кристалл также имеет плитку контроллера памяти со 128-битной шиной. Этот интерфейс управляет двумя каналами DDR5, что составляет четыре 40-битных подканала. Всего пакет поддерживает восемь каналов DDR5 (16 подканалов). Интерфейс PCIe/CXL для «Sapphire Rapids» огромен. Каждая матрица оснащена корневым комплексом PCI-Express Gen 5 + CXL 1.1 с 32 дорожками, что соответствует 128 дорожкам PCI-Express Gen 5 или CXL 1.1. Плитка Accelerator содержит Intel Data-Streaming Accelerator (DSA), технологию QuickAssist (QAT) и DLBoost 2.0, аппаратный компонент, который ускоряет построение и обучение нейронной сети с глубоким обучением.