Комп'ютерні новини
Всі розділи
Представлено графічний прискорювач NVIDIA Tesla V100
У минулому році на виставці GTC 2016 стартувала мікроархітектура NVIDIA Pascal шляхом анонсу графічного прискорювача NVIDIA Tesla P100. У цьому році, в рамках GTC 2017, представлений його нащадок у вигляді NVIDIA Tesla V100, який поклав початок поширенню мікроархітектури NVIDIA Volta. В його основі знаходиться графічний процесор NVIDIA GV100, побудований на базі 12-нм технології FFN від TSMC. Це найбільший GPU в арсеналі компанії – його площа складає 815 мм2, а загальна кількість транзисторів перевищила 21 млрд. До речі, на створення NVIDIA Tesla V100 знадобилося $3 млрд.
Першим важливим нововведенням у NVIDIA GV100 є інтеграція особливих ядер – Tensor Core, які призначені для прискорення процесів глибинного навчання. Другим є використання інтерфейсу NVLink 2.0 з пропускною спроможністю 300 Гб/с. Загалом структура NVIDIA GV100 містить 80 SM-блоків. Кожен з них має 64 CUDA-ядра для обчислень одинарної точності (FP32), 32 CUDA-ядра для обчислень подвійної точності (FP64) і 8 ядер Tensor Core. У підсумку ми маємо 5120 ядер FP32, 2560 FP64 і 640 Tensor Core. Динамічна частота роботи GPU сягає 1455 МГц. У масових користувацьких відеокартах CUDA-ядра FP64 не використовуються. Навряд чи ми побачимо й Tensor Core.
До речі, це ще не максимальна конфігурація, оскільки 4 SM-блоки відключені. Цілком можливо, що в майбутньому ми побачимо відеокарту NVIDIA TITAN Xv з 84 SM-блоками і 5376 CUDA-ядрами, як це сталося з NVIDIA TITAN Xp.
Підсистема відеопам'яті NVIDIA Tesla V100 містить 16 ГБ HBM2 з 4096-бітовоюї шиною, що відповідає показникові NVIDIA Tesla P100. Однак пропускна спроможність пам'яті в новинці сягнула 900 ГБ/с, а в попередника вона становила 720 ГБ/с. Зведена таблиця технічної специфікації графічних адаптерів серії NVIDIA Tesla:
Модель |
NVIDIA Tesla K40 |
NVIDIA Tesla M40 |
NVIDIA Tesla P100 |
NVIDIA Tesla V100 |
GPU |
GK110 (Kepler) |
GM200 (Maxwell) |
GP100 (Pascal) |
GV100 (Volta) |
Техпроцес, нм |
28 |
28 |
16 (FinFET+) |
12 (FFN) |
Площа GPU, мм2 |
551 |
601 |
610 |
815 |
Кількість транзисторів, млрд |
7,1 |
8 |
15,3 |
21,1 |
SM |
15 |
24 |
56 |
80 |
TPC |
15 |
24 |
28 |
40 |
Ядер FP32 / SM |
192 |
128 |
64 |
64 |
Ядер FP32 / GPU |
2880 |
3072 |
3584 |
5120 |
Ядер FP64 / SM |
64 |
4 |
32 |
32 |
Ядер FP64 / GPU |
960 |
96 |
1792 |
2560 |
Ядер Tensor / SM |
N/A |
N/A |
N/A |
8 |
Ядер Tensor / GPU |
N/A |
N/A |
N/A |
640 |
Динамічна частота GPU, МГц |
875 |
1114 |
1480 |
1455 |
Пікова обчислювальна потужність FP32, TFLOPS |
5,04 |
6,8 |
10,6 |
15 |
Пікова обчислювальна потужність FP64, TFLOPS |
1,68 |
2,1 |
5,3 |
7,5 |
Пікова обчислювальна потужність Tensor Core, Tensor TFLOPS |
N/A |
N/A |
N/A |
120 |
Текстурні блоки |
240 |
192 |
224 |
320 |
Тип відеопам’яті |
GDDR5 |
GDDR5 |
HBM2 |
HBM2 |
Об'єм відеопам'яті, ГБ |
12 |
24 |
16 |
16 |
Розрядність шини, бітів |
384 |
384 |
4096 |
4096 |
Кеш-пам’ять L2, КБ |
1536 |
3072 |
4096 |
6144 |
TDP, Вт |
235 |
250 |
300 |
300 |
https://www.techpowerup.com
https://videocardz.com
Сергій Буділовський