Комп'ютерні новини
Всі розділи
AMD представила Instinct MI350X: новий AI-процесор на CDNA 4 для конкуренції з NVIDIA Blackwell
AMD офіційно представила свій новий графічний процесор для штучного інтелекту – Instinct MI350X, заснований на передовій обчислювальній архітектурі CDNA 4. Цей потужний чип розроблений для прямої конкуренції з серією NVIDIA B200 "Blackwell", причому AMD вже порівнює свою топову модель Instinct MI355X з B200 у своїх презентаціях.
MI350X не тільки дебютує з архітектурою CDNA 4, але і є частиною новітнього програмного стека ROCm 7 та апаратної екосистеми. Ця екосистема базується на стандартній галузевій специфікації Open Compute Project і включає процесори AMD EPYC Zen 5, графічні процесори Instinct серії MI350, масштабовані мережеві карти AMD-Pensando Pollara з підтримкою Ultra-Ethernet, а також стандартні стійки та вузли, доступні як у формфакторах з повітряним, так і з рідинним охолодженням.
MI350 – це гігантський чиплетний графічний процесор для штучного інтелекту, що складається з багатошарового кремнію. Він має дві базові плитки, так звані кристали вводу/виводу (IOD), кожна з яких виготовлена за 6-нм техпроцесом TSMC N6. Ці IOD плитки містять мікроскопічну проводку для підключення до чотирьох плиток прискорювальних обчислювальних кристалів (XCD), розташованих зверху. Крім того, на IOD розташовані 128-канальні контролери пам'яті HBM3E, 256 МБ кеш-пам'яті Infinity, інтерфейси Infinity Fabric та кореневий комплекс PCI-Express 5.0 x16.
Самі ж XCD плитки виробляються за 3-нм техпроцесом TSMC N3P. Кожна XCD містить 4 МБ кешу L2 та чотири шейдерні рушії, кожен з яких має 9 обчислювальних блоків (CU). Таким чином, кожен XCD має 36 CU, а кожен IOD – 144 CU. Два IOD з'єднані двонапрямними з'єднанням зі швидкістю 5,5 ТБ/с, що забезпечує повну когерентність кешу між ними. Загалом, весь корпус містить 288 CU. Кожен IOD керує чотирма стеками HBM3E, надаючи 144 ГБ пам'яті, що в сумі дає 288 ГБ пам'яті для всього корпусу. Хоча MI350 з його 288 CU та 288 ГБ пам'яті може функціонувати як один графічний процесор, AMD запропонувала інноваційні способи його розділення та керування фізичною пам'яттю, як по IOD, так і по XCD.
На рівні платформи, кожен блейд-сервер підтримує до восьми графічних процесорів серії MI350. Пули пам'яті цих процесорів з'єднані мережею "точка-точка" з пропускною здатністю 153,6 Гбіт/с, забезпечуючи зв'язок між кожним пакетом на вузлі. Крім того, кожен пакет має підключення PCI-Express 5.0 x16 до одного з двох процесорів EPYC "Turin" вузла, які відповідають за послідовну обробку.