Intel Демонстрации 8

Блог

ДомДом / Блог / Intel Демонстрации 8

Jun 14, 2023

Intel Демонстрации 8

7-нм чип имеет 66 потоков на ядро ​​и обеспечивает скорость оптического ввода-вывода 1 ТБ/с. Intel представила свою первую фотонную ткань с прямым соединением ячеек на конференции по чипам Hot Chips 2023, подчеркнув свой прогресс в направлении

7-нм чип имеет 66 потоков на ядро ​​и обеспечивает скорость оптического ввода-вывода 1 ТБ/с.

Intel представила свою первую фотонную ткань с прямым соединением «сетка-сетка» на конференции по микросхемам Hot Chips 2023, подчеркнув свой прогресс на пути к будущему оптических соединений между кристаллами, которые также поддерживаются такими компаниями, как Nvidia и Ayar Labs. Однако восьмиядерный 528-поточный чип, который Intel использовала для демонстрации, привлек к себе всеобщее внимание благодаря своей уникальной архитектуре, которая имеет 66 потоков на ядро ​​и обеспечивает пропускную способность до 1 ТБ/с. Удивительно, но чип потребляет всего 75 Вт энергии, при этом ~60% мощности используется оптическими соединениями, но такая конструкция в конечном итоге может позволить напрямую подключать системы с двумя миллионами ядер с задержкой менее 400 нс.

Чип Intel PUMA (программируемая унифицированная архитектура памяти) является частью программы DARPA HIVE, которая направлена ​​на повышение производительности в работе по анализу графов петабайтного масштаба, чтобы обеспечить 1000-кратное улучшение производительности на ватт в гиперразреженных рабочих нагрузках.

Удивительно для такой компании, ориентированной на x86, как Intel, но тестовый чип использует специальную RISC-архитектуру для оптимизации производительности в рабочих нагрузках графического анализа, обеспечивая 8-кратное улучшение однопоточной производительности. Чип также создан с использованием 7-нм процесса TSMC, а не собственных внутренних узлов Intel.

Охарактеризовав целевые рабочие нагрузки, Intel пришла к выводу, что ей необходимо создать архитектуру, которая решит проблемы, связанные с чрезвычайной нагрузкой на подсистему памяти, глубокими конвейерами, предикторами ветвей и неупорядоченной логикой, создаваемой рабочей нагрузкой.

Специальное ядро ​​Intel использует экстремальный параллелизм: 66 аппаратных потоков для каждого из восьми ядер, большие кэши инструкций и данных L1, а также 4 МБ оперативной памяти SRAM на каждое ядро. Восьмиядерный чип имеет 32 оптических порта ввода-вывода, которые работают со скоростью 32 ГБ/с/канал каждый, что в сумме обеспечивает общую пропускную способность 1 ТБ/с. Чипы устанавливаются в серверную салазку OCP с восемью сокетами, обеспечивающую общую оптическую пропускную способность системы до 16 ТБ/с, а каждый чип питается от 32 ГБ специальной DDR5-4000 DRAM.

Intel создала чип по 7-нм техпроцессу TSMC с 27,6 миллиардами транзисторов, охватывающих кристалл размером 316 мм^2. Восемь ядер, потребляющих 1,2 миллиарда транзисторов, расположены в центре кристалла, окруженные восемью специальными контроллерами памяти с 8-байтовой степенью детализации доступа. Коммуникационные маршрутизаторы занимают «пустой» центр чипа. Чип также оснащен четырьмя высокоскоростными восьмиканальными оптическими чипсетами ввода-вывода, по два в верхней и нижней части кристалла, которые соединяют внутренние электрические сигналы с внешними оптическими соединениями. . Эти устройства подключаются через корпус Intel EMIB и используют протокол AIB. Чип также имеет соединение PCIe 4.0 x8 для связи с хост-системой.

Перемещение невероятного объема данных, генерируемых 528 потоками, вокруг кристалла, требует оптимизированного межсоединения, поэтому Intel разработала 2D-сетку на кристалле с 16 маршрутизаторами для перетасовки данных между ядрами, контроллерами памяти и межсоединениями кремниевой фотоники (восемь маршрутизаторов интегрированы в ядра ЦП, а шесть маршрутизаторов полностью предназначены только для перемещения данных).

Как вы можете видеть в альбоме выше, разъемы фотоники интегрированы в корпус чипа и свисают с боков чипа для внешнего подключения к другим чипам. Чип подключен к внешней оптической сети HyperX, которая обеспечивает комплексное соединение отдельных процессорных ядер. Эта невероятная сеть позволяет напрямую подключать до двух миллионов ядер с задержкой менее 400 нс.

Конечный результат впечатляет — чип потребляет всего 75 Вт, при этом 59% этого бюджета приходится на кремниевую фотонику, а 21% — на ядра. Intel утверждает, что повышенная производительность оптической сети позволяет практически идеально линейно масштабировать производительность от одного до 1000 ядер.

Перспективы оптических межсоединений стимулируют увеличение количества исследований, поскольку отрасль ищет будущие методы передачи данных, которые предлагают превосходные характеристики пропускной способности, задержки и энергопотребления по сравнению с традиционными методами связи между чипами. В то время как массовое внедрение межсоединений оптических чипов остается на горизонте, специализированные реализации, такие как те, которые поддерживают Intel, Nvidia и Ayar Labs, близки к готовности к крупномасштабному внедрению в ближайшем будущем.