Пошук по сайту

up

Комп'ютерні новини

Всі розділи

Представлено графічний прискорювач NVIDIA Tesla V100

У минулому році на виставці GTC 2016 стартувала мікроархітектура NVIDIA Pascal шляхом анонсу графічного прискорювача NVIDIA Tesla P100. У цьому році, в рамках GTC 2017, представлений його нащадок у вигляді NVIDIA Tesla V100, який поклав початок поширенню мікроархітектури NVIDIA Volta. В його основі знаходиться графічний процесор NVIDIA GV100, побудований на базі 12-нм технології FFN від TSMC. Це найбільший GPU в арсеналі компанії – його площа складає 815 мм2, а загальна кількість транзисторів перевищила 21 млрд. До речі, на створення NVIDIA Tesla V100 знадобилося $3 млрд.

NVIDIA Tesla V100

Першим важливим нововведенням у NVIDIA GV100 є інтеграція особливих ядер – Tensor Core, які призначені для прискорення процесів глибинного навчання. Другим є використання інтерфейсу NVLink 2.0 з пропускною спроможністю 300 Гб/с. Загалом структура NVIDIA GV100 містить 80 SM-блоків. Кожен з них має 64 CUDA-ядра для обчислень одинарної точності (FP32), 32 CUDA-ядра для обчислень подвійної точності (FP64) і 8 ядер Tensor Core. У підсумку ми маємо 5120 ядер FP32, 2560 FP64 і 640 Tensor Core. Динамічна частота роботи GPU сягає 1455 МГц. У масових користувацьких відеокартах CUDA-ядра FP64 не використовуються. Навряд чи ми побачимо й Tensor Core.

NVIDIA Tesla V100

До речі, це ще не максимальна конфігурація, оскільки 4 SM-блоки відключені. Цілком можливо, що в майбутньому ми побачимо відеокарту NVIDIA TITAN Xv з 84 SM-блоками і 5376 CUDA-ядрами, як це сталося з NVIDIA TITAN Xp.

NVIDIA Tesla V100

Підсистема відеопам'яті NVIDIA Tesla V100 містить 16 ГБ HBM2 з 4096-бітовоюї шиною, що відповідає показникові NVIDIA Tesla P100. Однак пропускна спроможність пам'яті в новинці сягнула 900 ГБ/с, а в попередника вона становила 720 ГБ/с. Зведена таблиця технічної специфікації графічних адаптерів серії NVIDIA Tesla:

Модель

NVIDIA Tesla K40

NVIDIA Tesla M40

NVIDIA Tesla P100

NVIDIA Tesla V100

GPU

GK110 (Kepler)

GM200 (Maxwell)

GP100 (Pascal)

GV100 (Volta)

Техпроцес, нм

28

28

16 (FinFET+)

12 (FFN)

Площа GPU, мм2

551

601

610

815

Кількість транзисторів, млрд

7,1

8

15,3

21,1

SM

15

24

56

80

TPC

15

24

28

40

Ядер FP32 / SM

192

128

64

64

Ядер FP32 / GPU

2880

3072

3584

5120

Ядер FP64 / SM

64

4

32

32

Ядер FP64 / GPU

960

96

1792

2560

Ядер Tensor / SM

N/A

N/A

N/A

8

Ядер Tensor / GPU

N/A

N/A

N/A

640

Динамічна частота GPU, МГц

875

1114

1480

1455

Пікова обчислювальна потужність FP32, TFLOPS

5,04

6,8

10,6

15

Пікова обчислювальна потужність FP64, TFLOPS

1,68

2,1

5,3

7,5

Пікова обчислювальна потужність Tensor Core, Tensor TFLOPS

N/A

N/A

N/A

120

Текстурні блоки

240

192

224

320

Тип відеопам’яті

GDDR5

GDDR5

HBM2

HBM2

Об'єм відеопам'яті, ГБ

12

24

16

16

Розрядність шини, бітів

384

384

4096

4096

Кеш-пам’ять L2, КБ

1536

3072

4096

6144

TDP, Вт

235

250

300

300

https://www.techpowerup.com
https://videocardz.com
Сергій Буділовський