Пошук по сайту

up

Комп'ютерні новини

Всі розділи

Детальний погляд на графічний процесор NVIDIA GP100 (Pascal)

Після офіційної презентації прискорювача NVIDIA Tesla P100 з'явилися дуже цікаві подробиці про використаний у ньому графічний процесор NVIDIA GP100. Оскільки це флагманський GPU серії NVIDIA Pascal, його конфігурація є максимальною. Тобто в звичайних масових відеокартах ми не побачимо більшої кількості структурних компонентів.

NVIDIA GP100

Офіційна блок-схема GPU NVIDIA GP100. Цікаво, що на діаграмі зображено 60 SM-блоків, хоча для NVIDIA GP100 заявлено лише 56

Почнемо з того, що перехід з 28-нм на 16-нм техпроцес дозволив компанії NVIDIA практично подвоїти кількість транзисторів (з 8 млрд. до 15,3 млрд.) У порівнянні з попереднім флагманом, зберігши загальну площу кристала практично незмінною (601 мм2 проти 610 мм2).

NVIDIA GP100

Друга важлива зміна стосується кількості структурних компонентів в одному SM-модулі. Мікроархітектура NVIDIA Maxwell передбачала використання 128 звичайних CUDA-ядер (FP32) і 4 CUDA-ядер для обчислень подвійної точності. В результаті загальна кількість цих структурних блоків у GPU NVIDIA GM200 становила 3072 і 96 відповідно. Мікроархітектура NVIDIA GP100 передбачає інтеграцію в кожен SM-модуль 64 звичайних CUDA-ядер і 32 CUDA-ядер для обчислень подвійної точності. Відповідно, максимальна загальна кількість перших досягне 3584, а других - 1792. Цим пояснюється величезний стрибок у швидкості обчислень подвійної точності: з 213 до 5304 GFLOPS.

Вразили й тактові частоти роботи графічного процесора NVIDIA GP100: в номінальному режимі вона становить 1328 МГц, а в динамічному сягає 1480 МГц. При цьому показник TDP новинки зріс на 50 Вт: з 250 до 300 Вт. Порівняльна таблиця технічної специфікації відеокарти NVIDIA Tesla P100 зі своїми попередниками:

Модель

NVIDIA Tesla K40

NVIDIA Tesla M40

NVIDIA Tesla P100

GPU

NVIDIA GK110

NVIDIA GM200

NVIDIA GP100

Мікроархітектура

NVIDIA Kepler

NVIDIA Maxwell

NVIDIA Pascal

Техпроцес, нм

28

28

16

Площа GPU, мм2

551

601

610

Кількість транзисторів, млрд.

7,1

8

15,3

Кількість SM-модулів

15

24

56

Кількість CUDA-ядер

2880

3072

3584

Кількість CUDA-ядер для обчислень подвійної точності

960

96

1792

Кількість текстурних блоків

240

192

224

Базова / динамічна тактова частота, МГц

745 / 875

948 / 1114

1328 / 1480

Тип відеопам'яті

GDDR5

GDDR5

HBM2

Об’єм пам’яті, ГБ

12

24

16

Розрядність шини, бітів

384

384

4096

Швидкість обчислень подвійної точності, GFLOPS

1680

213

5304

TDP, Вт

235

250

300

http://www.pcworld.com
Сергій Буділовський