Комп'ютерні новини

Всі розділи

11-05-2017 09:02

Представлено графічний прискорювач NVIDIA Tesla V100

У минулому році на виставці GTC 2016 стартувала мікроархітектура NVIDIA Pascal шляхом анонсу графічного прискорювача NVIDIA Tesla P100. У цьому році, в рамках GTC 2017, представлений його нащадок у вигляді NVIDIA Tesla V100, який поклав початок поширенню мікроархітектури NVIDIA Volta. В його основі знаходиться графічний процесор NVIDIA GV100, побудований на базі 12-нм технології FFN від TSMC. Це найбільший GPU в арсеналі компанії – його площа складає 815 мм², а загальна кількість транзисторів перевищила 21 млрд. До речі, на створення NVIDIA Tesla V100 знадобилося $3 млрд.

Першим важливим нововведенням у NVIDIA GV100 є інтеграція особливих ядер – Tensor Core, які призначені для прискорення процесів глибинного навчання. Другим є використання інтерфейсу NVLink 2.0 з пропускною спроможністю 300 Гб/с. Загалом структура NVIDIA GV100 містить 80 SM-блоків. Кожен з них має 64 CUDA-ядра для обчислень одинарної точності (FP32), 32 CUDA-ядра для обчислень подвійної точності (FP64) і 8 ядер Tensor Core. У підсумку ми маємо 5120 ядер FP32, 2560 FP64 і 640 Tensor Core. Динамічна частота роботи GPU сягає 1455 МГц. У масових користувацьких відеокартах CUDA-ядра FP64 не використовуються. Навряд чи ми побачимо й Tensor Core.

До речі, це ще не максимальна конфігурація, оскільки 4 SM-блоки відключені. Цілком можливо, що в майбутньому ми побачимо відеокарту NVIDIA TITAN Xv з 84 SM-блоками і 5376 CUDA-ядрами, як це сталося з NVIDIA TITAN Xp.

Підсистема відеопам'яті NVIDIA Tesla V100 містить 16 ГБ HBM2 з 4096-бітовоюї шиною, що відповідає показникові NVIDIA Tesla P100. Однак пропускна спроможність пам'яті в новинці сягнула 900 ГБ/с, а в попередника вона становила 720 ГБ/с. Зведена таблиця технічної специфікації графічних адаптерів серії NVIDIA Tesla:

Модель	NVIDIA Tesla K40	NVIDIA Tesla M40	NVIDIA Tesla P100	NVIDIA Tesla V100
GPU	GK110 (Kepler)	GM200 (Maxwell)	GP100 (Pascal)	GV100 (Volta)
Техпроцес, нм	28	28	16 (FinFET+)	12 (FFN)
Площа GPU, мм²	551	601	610	815
Кількість транзисторів, млрд	7,1	8	15,3	21,1
SM	15	24	56	80
TPC	15	24	28	40
Ядер FP32 / SM	192	128	64	64
Ядер FP32 / GPU	2880	3072	3584	5120
Ядер FP64 / SM	64	4	32	32
Ядер FP64 / GPU	960	96	1792	2560
Ядер Tensor / SM	N/A	N/A	N/A	8
Ядер Tensor / GPU	N/A	N/A	N/A	640
Динамічна частота GPU, МГц	875	1114	1480	1455
Пікова обчислювальна потужність FP32, TFLOPS	5,04	6,8	10,6	15
Пікова обчислювальна потужність FP64, TFLOPS	1,68	2,1	5,3	7,5
Пікова обчислювальна потужність Tensor Core, Tensor TFLOPS	N/A	N/A	N/A	120
Текстурні блоки	240	192	224	320
Тип відеопам’яті	GDDR5	GDDR5	HBM2	HBM2
Об'єм відеопам'яті, ГБ	12	24	16	16
Розрядність шини, бітів	384	384	4096	4096
Кеш-пам’ять L2, КБ	1536	3072	4096	6144
TDP, Вт	235	250	300	300

https://www.techpowerup.com
https://videocardz.com
Сергій Буділовський

<< Попередня новина

Наступна новина >>

Пошук по сайту

Комп'ютерні новини

Всі розділи

Представлено графічний прискорювач NVIDIA Tesla V100