Комп'ютерні новини
Всі розділи
Детальний погляд на графічний процесор NVIDIA GP100 (Pascal)
Після офіційної презентації прискорювача NVIDIA Tesla P100 з'явилися дуже цікаві подробиці про використаний у ньому графічний процесор NVIDIA GP100. Оскільки це флагманський GPU серії NVIDIA Pascal, його конфігурація є максимальною. Тобто в звичайних масових відеокартах ми не побачимо більшої кількості структурних компонентів.
Офіційна блок-схема GPU NVIDIA GP100. Цікаво, що на діаграмі зображено 60 SM-блоків, хоча для NVIDIA GP100 заявлено лише 56
Почнемо з того, що перехід з 28-нм на 16-нм техпроцес дозволив компанії NVIDIA практично подвоїти кількість транзисторів (з 8 млрд. до 15,3 млрд.) У порівнянні з попереднім флагманом, зберігши загальну площу кристала практично незмінною (601 мм2 проти 610 мм2).
Друга важлива зміна стосується кількості структурних компонентів в одному SM-модулі. Мікроархітектура NVIDIA Maxwell передбачала використання 128 звичайних CUDA-ядер (FP32) і 4 CUDA-ядер для обчислень подвійної точності. В результаті загальна кількість цих структурних блоків у GPU NVIDIA GM200 становила 3072 і 96 відповідно. Мікроархітектура NVIDIA GP100 передбачає інтеграцію в кожен SM-модуль 64 звичайних CUDA-ядер і 32 CUDA-ядер для обчислень подвійної точності. Відповідно, максимальна загальна кількість перших досягне 3584, а других - 1792. Цим пояснюється величезний стрибок у швидкості обчислень подвійної точності: з 213 до 5304 GFLOPS.
Вразили й тактові частоти роботи графічного процесора NVIDIA GP100: в номінальному режимі вона становить 1328 МГц, а в динамічному сягає 1480 МГц. При цьому показник TDP новинки зріс на 50 Вт: з 250 до 300 Вт. Порівняльна таблиця технічної специфікації відеокарти NVIDIA Tesla P100 зі своїми попередниками:
Модель |
NVIDIA Tesla K40 |
NVIDIA Tesla M40 |
NVIDIA Tesla P100 |
GPU |
NVIDIA GK110 |
NVIDIA GM200 |
NVIDIA GP100 |
Мікроархітектура |
NVIDIA Kepler |
NVIDIA Maxwell |
NVIDIA Pascal |
Техпроцес, нм |
28 |
28 |
16 |
Площа GPU, мм2 |
551 |
601 |
610 |
Кількість транзисторів, млрд. |
7,1 |
8 |
15,3 |
Кількість SM-модулів |
15 |
24 |
56 |
Кількість CUDA-ядер |
2880 |
3072 |
3584 |
Кількість CUDA-ядер для обчислень подвійної точності |
960 |
96 |
1792 |
Кількість текстурних блоків |
240 |
192 |
224 |
Базова / динамічна тактова частота, МГц |
745 / 875 |
948 / 1114 |
1328 / 1480 |
Тип відеопам'яті |
GDDR5 |
GDDR5 |
HBM2 |
Об’єм пам’яті, ГБ |
12 |
24 |
16 |
Розрядність шини, бітів |
384 |
384 |
4096 |
Швидкість обчислень подвійної точності, GFLOPS |
1680 |
213 |
5304 |
TDP, Вт |
235 |
250 |
300 |