Пошук по сайту

up
Banner

Комп'ютерні новини

Відеокарти

Фото та деякі характеристики GPU NVIDIA GP104 і NVIDIA GP106

Днями компанія NVIDIA презентувала флагманський графічний процесор NVIDIA GP100 і професійну відеокарту NVIDIA Tesla P100 на його основі. Тепер в інтернет проникли перші фото та подробиці менш продуктивних GPU, які будуть використані в масових відеокартах, призначених для користувачів.

NVIDIA GP104

Почнемо з NVIDIA GP104, який можна буде зустріти в моделях NVIDIA GeForce GTX 1070 і NVIDIA GeForce GTX 1080. Орієнтовна площа кристала становить 290 – 300 мм2, що на 100 мм2 менше, ніж у його попередника NVIDIA GM204 (398 мм2). При цьому кількість транзисторів зросла з 5,2 млрд. до 7,4 – 7,9 млрд. Шкода, що при цьому не уточнюють рівень TDP нових відеокарт.

NVIDIA GP104

За попередніми даними, NVIDIA GeForce GTX 1070 має в своєму складі 36 SM-блоків, тобто 2304 CUDA-ядер і 144 текстурних блоків. У NVIDIA GeForce GTX 1080 кількість SM-блоків збільшено до 40, у результаті маємо 2560 CUDA-ядер і 160 текстурних блоків. Для набору відеопам'яті обидві моделі використовують 8-гігабітні чіпи Samsung K4G80325FB-HC25 з 256-бітної шиною та ефективною частотою 8 ГГц.

NVIDIA GP106

У свою чергу NVIDIA GP106 характеризується ще меншою загальною площею (170 – 200 мм2). Нагадаємо, що у його попередника, NVIDIA GM206, цей показник сягав 227 мм2. Новинка буде використовуватися в відеокартах NVIDIA GeForce GTX 1050 і NVIDIA GeForce GTX 1060, оснащених 4 ГБ GDDR5-пам'яті. Найменшим графічним процесором у серії NVIDIA Pascal стане NVIDIA GP107, який стане основою бюджетних моделей.

Порівняльна таблиця технічної специфікації GPU NVIDIA GP104 і NVIDIA GP100:

GPU

NVIDIA GM204

NVIDIA GP106

NVIDIA GP104

NVIDIA GP100

Відеокарти на його основі

NVIDIA GeForce GTX 970 / NVIDIA GeForce GTX 980

NVIDIA GeForce GTX 1050 / NVIDIA GeForce GTX 1060

NVIDIA GeForce GTX 1070 / NVIDIA GeForce GTX 1080

NVIDIA Tesla P100

Мікроархітектура

NVIDIA Maxwell

NVIDIA Pascal

NVIDIA Pascal

NVIDIA Pascal

Техпроцес, нм

28

16

16

16

Площа GPU, мм2

398

170 – 200

290 – 300

610

Кількість транзисторів, млрд.

5,2

-

7,4 – 7,9

15,3

Кількість SM-модулів

13 / 16

16 / 20

36 / 40

56

Кількість CUDA-ядер

1664 / 2048

1024 / 1280

2304 / 2560

3584

Кількість текстурних блоків

104 / 128

64 / 80

144 / 160

224

Тип відеопам’яті

GDDR5

GDDR5

GDDR5

HBM2

Об’єм пам’яті, ГБ

4

4

8

16

Розрядність шини, бітів

256

128 / 256

256

4096

TDP, Вт

145 / 165

- / -

- / -

300

http://wccftech.com
Сергій Буділовський

Постійне посилання на новину

Можливі терміни появи AMD Polaris і NVIDIA Pascal

Схоже, що літо 2016 року буде дуже спекотним у сегменті графічних адаптерів. Відповідно до неофіційної інформації з джерел, близьких до виробників відеокарт, компанії AMD і NVIDIA намітили реліз нових продуктів саме на літо.

AMD Polaris 10

Повідомляється, що високопродуктивні відеокарти AMD Radeon R9 490 і AMD Radeon R9 490X, засновані на 14-нм мікроархітектурі AMD Polaris 10, можуть бути анонсовані вже в межах виставки Computex 2016 на початку червня. Повноцінний реліз очікується наприкінці червня, однак поки невідомо, чи надійдуть вони відразу в продаж. Справа в тому, що деякі джерела згадують про використання в них пам'яті GDDR5X, масове виробництво якої почнеться влітку.

NVIDIA GeForce GTX 1070 NVIDIA GeForce GTX 1080

У свою чергу компанія NVIDIA хоче ще швидше вивести на ринок свою 16-нм мікроархітектуру NVIDIA Pascal. Дебют продуктивних моделей NVIDIA GeForce GTX 1070 і NVIDIA GeForce GTX 1080 ймовірно відбудеться вже в кінці травня - на початку червня. На ринку вони з'являться в липні.

http://www.dvhardware.net
Сергій Буділовський

Постійне посилання на новину

Терміни появи відеокарти AMD Radeon Pro Duo у продажі

У середині березня був представлений графічний адаптер AMD Radeon Pro Duo. Тепер же стало відомо, що у продаж він надійде з 26 квітня за орієнтовною вартістю $1499, тобто займе ціновий сегмент свого попередника – AMD Radeon R9 295X2. Партнери компанії AMD зможуть продавати новинку під власним брендом, але при цьому повинні використовувати референсний її дизайн. Тобто істотних змін у компонуванні друкованої плати або системи охолодження не передбачається.

AMD Radeon Pro Duo

Нагадаємо, що AMD Radeon Pro Duo в першу чергу призначена для використання у високопродуктивних ігрових системах, а також для перегляду та створення VR-контенту. Вона складається із двох графічних процесорів AMD Fiji XT, кожен з яких оснащений 4 ГБ HBM-пам'яті. Обчислювальна потужність подібного зв'язування досягає 16 TFLOPS. Однак для коректної роботи новинка вимагає підключення трьох 8-контактних конекторів PCIe, тому потужний блок живлення в такій системі є обов'язковим елементом.

Зведена таблиця технічної специфікації відеокарти AMD Radeon Pro Duo:

Модель

AMD Radeon Pro Duo

GPU

2 х AMD Fiji XT

Мікроархітектура

AMD GCN

Техпроцес, нм

28

Кількість потокових процесорів

8192 (2 x 4096)

Кількість текстурних блоків

512 (2 x 256)

Кількість растрових блоків

128 (2 x 64)

Тактова частота GPU, МГц

730 / 1000

Тип відеопам'яті

HBM

Об’єм, ГБ

8 (2 x 4)

Номінальна / ефективна частота пам'яті, МГц

500 / 1000

Ширина шини пам'яті, біт

8192 (2 x 4096)

Пропускна здатність пам'яті, ГБ/с

1024 (2 х 512)

Внутрішній інтерфейс

PCI Express 3.0 x16

Обчислювальна потужність, TFLOPS

16

Додаткові роз’єми живлення PCIe

3 x 8-контактні

Орієнтовна вартість, $

1499

http://www.techpowerup.com
Сергій Буділовський

Постійне посилання на новину

Детальний погляд на графічний процесор NVIDIA GP100 (Pascal)

Після офіційної презентації прискорювача NVIDIA Tesla P100 з'явилися дуже цікаві подробиці про використаний у ньому графічний процесор NVIDIA GP100. Оскільки це флагманський GPU серії NVIDIA Pascal, його конфігурація є максимальною. Тобто в звичайних масових відеокартах ми не побачимо більшої кількості структурних компонентів.

NVIDIA GP100

Офіційна блок-схема GPU NVIDIA GP100. Цікаво, що на діаграмі зображено 60 SM-блоків, хоча для NVIDIA GP100 заявлено лише 56

Почнемо з того, що перехід з 28-нм на 16-нм техпроцес дозволив компанії NVIDIA практично подвоїти кількість транзисторів (з 8 млрд. до 15,3 млрд.) У порівнянні з попереднім флагманом, зберігши загальну площу кристала практично незмінною (601 мм2 проти 610 мм2).

NVIDIA GP100

Друга важлива зміна стосується кількості структурних компонентів в одному SM-модулі. Мікроархітектура NVIDIA Maxwell передбачала використання 128 звичайних CUDA-ядер (FP32) і 4 CUDA-ядер для обчислень подвійної точності. В результаті загальна кількість цих структурних блоків у GPU NVIDIA GM200 становила 3072 і 96 відповідно. Мікроархітектура NVIDIA GP100 передбачає інтеграцію в кожен SM-модуль 64 звичайних CUDA-ядер і 32 CUDA-ядер для обчислень подвійної точності. Відповідно, максимальна загальна кількість перших досягне 3584, а других - 1792. Цим пояснюється величезний стрибок у швидкості обчислень подвійної точності: з 213 до 5304 GFLOPS.

Вразили й тактові частоти роботи графічного процесора NVIDIA GP100: в номінальному режимі вона становить 1328 МГц, а в динамічному сягає 1480 МГц. При цьому показник TDP новинки зріс на 50 Вт: з 250 до 300 Вт. Порівняльна таблиця технічної специфікації відеокарти NVIDIA Tesla P100 зі своїми попередниками:

Модель

NVIDIA Tesla K40

NVIDIA Tesla M40

NVIDIA Tesla P100

GPU

NVIDIA GK110

NVIDIA GM200

NVIDIA GP100

Мікроархітектура

NVIDIA Kepler

NVIDIA Maxwell

NVIDIA Pascal

Техпроцес, нм

28

28

16

Площа GPU, мм2

551

601

610

Кількість транзисторів, млрд.

7,1

8

15,3

Кількість SM-модулів

15

24

56

Кількість CUDA-ядер

2880

3072

3584

Кількість CUDA-ядер для обчислень подвійної точності

960

96

1792

Кількість текстурних блоків

240

192

224

Базова / динамічна тактова частота, МГц

745 / 875

948 / 1114

1328 / 1480

Тип відеопам'яті

GDDR5

GDDR5

HBM2

Об’єм пам’яті, ГБ

12

24

16

Розрядність шини, бітів

384

384

4096

Швидкість обчислень подвійної точності, GFLOPS

1680

213

5304

TDP, Вт

235

250

300

http://www.pcworld.com
Сергій Буділовський

Постійне посилання на новину

Серія відеокарт EVGA GeForce GTX 950 Low Power включає до свого складу чотири моделі

Компанія EVGA презентувала відразу чотири нові відеокарти серії EVGA GeForce GTX 950 Low Power, ключовою перевагою яких є знижене енергоспоживання, тому для коректної роботи вони не вимагають підключення 6-контактного кабелю PCIe.

EVGA GeForce GTX 950 Low Power

Також представлені новинки характеризуються компактними розмірами й одновентиляторною фірмовою системою охолодження ACX 2.0. У результаті вони відмінно підійдуть для використання в компактних середньопродуктивних ігрових системах.

EVGA GeForce GTX 950 Low Power

Що ж стосується технічних характеристик, то базова та динамічна частоти графічного процесора моделей EVGA GeForce GTX 950 (02G-P4-0952) і EVGA GeForce GTX 950 (02G-P4-0954) знаходяться на рівні 1025 і 1190 МГц відповідно. У версіях EVGA GeForce GTX 950 SC (02G-P4-0956) і EVGA GeForce GTX 950 SC (02G-P4-0958) аналогічні показники становлять 1076 і 1253 МГц. А от підсистема оперативної пам'яті в них однакова – 2 ГБ GDDR5 з ефективною частотою 6608 МГц і 128-бітною шиною.

EVGA GeForce GTX 950 Low Power

Порівняльна таблиця технічної специфікації відеокарт серії EVGA GeForce GTX 950 Low Power:

Модель

EVGA GeForce GTX 950 (02G-P4-0952)

EVGA GeForce GTX 950 (02G-P4-0954)

EVGA GeForce GTX 950 SC (02G-P4-0956)

EVGA GeForce GTX 950 SC (02G-P4-0958)

GPU

NVIDIA GM206-250

Мікроархітектура

NVIDIA Maxwell

Техпроцес, нм

28

Кількість CUDA-ядер

768

Кількість текстурних блоків

48

Кількість растрових блоків

32

Тактова частота GPU, МГц

1025 / 1190

1076 / 1253

Тип відеопам'яті

GDDR5

Об’єм, ГБ

2

Номінальна / ефективна частота пам'яті, МГц

1652 / 6608

Ширина шини пам'яті, біт

128

Пропускна здатність пам'яті, ГБ/с

105,73

Зовнішні інтерфейси

1 x DVI-I
 1 x HDMI
 1 x DisplayPort

1 x DVI-I
 1 x DVI-D
 1 x HDMI
 1 x DisplayPort

1 x DVI-I
 1 x HDMI
 1 x DisplayPort

1 x DVI-I
 1 x DVI-D
 1 x HDMI
 1 x DisplayPort

http://www.techpowerup.com
http://www.evga.com
Сергій Буділовський

Постійне посилання на новину

NVIDIA на GTC 2016: анонс мікроархітектури NVIDIA Pascal і ряд інших інновацій

В каліфорнійському місті Сан-Хосе успішно стартувала GPU Technology Conference (GTC), у рамках якої компанія NVIDIA зробила ряд важливих анонсів своїх майбутніх продуктів. У першу чергу багатьох цікавить мікроархітектура NVIDIA Pascal, тому з неї й почнемо.

NVIDIA Tesla P100

NVIDIA Tesla P100

Першим офіційним анонсом нової мікроархітектури стали не масові користувацькі відеокарти, а прискорювач для надмасштабованих дата-центрів − NVIDIA Tesla P100. З його допомогою можна створювати новий клас серверів із продуктивністю рівня кількох сотень класичних серверів на базі CPU. Потужності подібних рішень буде достатньо для нового покоління наукових додатків і завдань, пов'язаних зі штучним інтелектом, для яких потрібні надефективні, ультрашвидкісні серверні вузли.

NVIDIA Tesla P100

Модель NVIDIA Tesla P100 використовує п'ять передових технологій для забезпечення високої продуктивності й ефективності використання ресурсів:

  • Мікроархітектура NVIDIA Pascal підвищує швидкість навчання нейронних мереж в 12 разів у порівнянні з рішеннями на базі NVIDIA Maxwell.
  • Високошвидкісний інтерфейс NVIDIA NVLink використовується для зв'язку між кількома графічними процесорами. Він більш ефективно розподіляє навантаження між GPU, збільшуючи пропускну здатність в 5 разів у порівнянні із кращими на сьогодні рішеннями в даному класі. NVIDIA NVLink дозволяє зв'язати до восьми GPU NVIDIA Tesla P100. IBM уже впровадила цей інтерфейс у свої процесори POWER8 для високошвидкісної комунікації між CPU і GPU.
  • 16-нм FinFET-технологія дозволила інтегрувати в процесор 15,3 млрд. транзисторів, що гарантує найвищу продуктивність і енергоефективність.
  • Інноваційний підхід до побудови пам'яті CHIP-ON-WAFER-ON-SUBSTRATE (CoWoS) з HBM2 підвищує пропускну здатність в 3 рази (до 720 ГБ/с) у порівнянні з архітектурою NVIDIA Maxwell.
  • Нові алгоритми штучного інтелекту забезпечують пікову продуктивність понад 21 TFLOPS у завданнях глибокого навчання.

Використання прискорювача NVIDIA Tesla P100 дозволяє досягнути феноменальних результатів. Наприклад, додаток молекулярної динаміки AMBER працює швидше на одному сервері з NVIDIA Tesla P100, аніж на 48 звичайних двосокетних серверних вузлах. А для навчання популярної глибокої нейронної мережі AlexNet буде потрібно 250 двосокетних серверних вузлів, щоб досягнути продуктивності восьми GPU NVIDIA Tesla P100.

Ключові характеристики NVIDIA Tesla P100:

Модель

NVIDIA Tesla P100

Тип пам'яті

CoWoS HBM2

Об’єм пам'яті

16 ГБ

Смуга пропускання

720 ГБ/с

Інтерфейс

Двонаправлений NVIDIA NVLink

Пропускна здатність інтерфейсу

160 ГБ/с

Швидкість обчислень подвійної точності

5,3 TFLOPS

Швидкість обчислень одинарної точності

10,6 TFLOPS

Швидкість обчислень половинної точності

21,2 TFLOPS

Додаткові переваги

Поліпшена програмованість із рушієм переходу по сторінках і уніфікованою пам'яттю
Захист ECC для підвищеної надійності
Оптимізація під сервер для високої пропускної здатності та надійності дата-центру

Оновлення в NVIDIA SDK

Підвищена обчислювальна потужність і розширені функціональні можливості потребували оновлення платформи NVIDIA SDK. У число ключових змін входить NVIDIA CUDA 8. Новітня версія платформи паралельних обчислень NVIDIA надає розробникам прямий доступ до нових можливостей мікроархітектури NVIDIA Pascal, включаючи уніфіковану пам'ять та інтерфейс NVIDIA NVLink. Крім того, в актуальний реліз входить бібліотека аналізу графів nvGRAPH, яку можна використовувати для розрахунків траєкторій, інформаційної безпеки й аналізу логістики, яка включає в сферу застосування GPU-прискорених обчислень аналітику Big Data.

NVIDIA SDK

Для мереж глибокого навчання NVIDIA анонсувала GPU-прискорювану бібліотеку примітивів cuDNN версії 5. Вона включає в себе підтримку GPU NVIDIA Pascal, прискорення рекуррентних нейронних мереж, використовуваних для відео й інших послідовних даних, а також ряд поліпшень, призначених для застосування в медичній, нафтогазовій та інших областях промисловості. cuDNN прискорює роботу ведучих фреймворків глибокого навчання, включаючи TensorFlow від Google, Caffe від Університету Берклі, Theano від Університету Монреаля та Torch від Нью-Йоркського Університету, які, у свою чергу, знаходяться в основі рішень від Amazon, Facebook, Google та інших компаній.

NVIDIA DGX-1

NVIDIA DGX-1 – це перший у світі суперкомп'ютер для глибокого навчання, який має достатню обчислювальну потужність для розвитку штучного інтелекту (ШІ). Він розроблений спеціально для завдань глибокого навчання (Deep Learning). Система NVIDIA DGX-1 оснащена всім необхідним апаратним і програмним забезпеченням для глибокого навчання й інструментами розробки для швидкого та легкого розгортання.

NVIDIA DGX-1

В основі новинки знаходяться графічні прискорювачі NVIDIA Tesla P100 з високошвидкісним інтерфейсом NVIDIA NVLink і 16 ГБ пам'яті CoWoS HBM2. У результаті обчислювальну потужність NVIDIA DGX-1 можна зіставити з 250 традиційними серверами на базі CPU.

У свою чергу набір комплектного ПЗ містить у собі NVIDIA Deep Learning GPU Training System (DIGITS), повноцінну інтерактивну систему для створення глибоких нейронних мереж (DNN), а також NVIDIA CUDA Deep Neural Network (cuDNN) версії 5 − GPU-прискорювану бібліотеку примітивів для створення DNN.

В США системи глибокого навчання NVIDIA DGX-1 будуть доступні прямо в NVIDIA і у деяких партнерів у червні, в інших регіонах − у третьому кварталі поточного року. Також очікується, що прискорювач NVIDIA Tesla P100 з'явиться в складі серверів від провідних виробників на початку 2017 року.

Ключові характеристики системи NVIDIA DGX-1:

Назва

NVIDIA DGX-1

Використовувані прискорювачі

8 х NVIDIA Tesla P100

Об’єм пам'яті кожного прискорювача

16 ГБ

Інтерфейс

NVLink Hybrid Cube Mesh

Постійна пам'ять

7 ТБ SSD

Пікова продуктивність обчислень половинної точності

170 TFLOPS

Мережеві інтерфейси

Dual 10 GbE, Quad InfiniBand 100Gb

Формат

3U

Потужність

3200 Вт

http://www.nvidia.com
Сергій Буділовський

Постійне посилання на новину

AMD FirePro S9300 x2 – перший у світі серверний графічний прискорювач із підтримкою HBM-пам'яті

Компанія AMD з гордістю представила свій флагманський графічний прискорювач для серверних систем – AMD FirePro S9300 x2. Він призначений для використання в складних обчислювальних завданнях, наприклад, для аналізу великих масивів даних, у сфері молекулярної динаміки, при вивченні астрономічних процесів, у глибоких нейронних мережах та інших.

AMD FirePro S9300 x2

Новинка побудована на основі двох GPU AMD Fiji у максимальній їхній конфігурації (4096 потокових процесорів у кожному), які працюють на частоті 850 МГц. Кожен з них використовує власні 4 ГБ HBM-пам'яті з ефективною частотою 1000 МГц і пропускною здатністю 512 ГБ/с. Завдяки цьому обчислювальна потужність досягає 13,9 TFLOPS, що суттєво вище конкурентних аналогів у вигляді NVIDIA Tesla K80 (5,6 TFLOPS) і NVIDIA Tesla M60 (7,4 TFLOPS).

AMD FirePro S9300 x2

Важливою перевагою AMD FirePro S9300 x2 є підтримка програмного стеку AMD GPUOpen, який реалізує апаратне прискорення програмного коду, написаного на C++ або OpenCL. У продаж новинка надійде в другому кварталі за орієнтовною вартістю $5999.

AMD FirePro S9300 x2

Зведена таблиця технічної специфікації графічного адаптера AMD FirePro S9300 x2:

Модель

AMD FirePro S9300 x2

Використовувана мікроархітектура

AMD GCN

Кількість графічних процесорів

2

Тип графічних процесорів

AMD Fiji

Кількість потокових процесорів

2 x 4096

Тактова частота GPU, МГц

850

Тип відеопам'яті

HBM

Об’єм, ГБ

2 x 4

Базова / ефективна частота пам'яті, МГц

500 / 1000

Пропускна здатність, ГБ/с

2 х 512

Максимальна обчислювальна потужність (одинарна точність), TFLOPS

13,9

Максимальна обчислювальна потужність (подвійна точність), GFLOPS

870

Тип системи охолодження

Двослотова, пасивна

Внутрішній інтерфейс

PCI Express 3.0 x16

Додаткові роз’єми живлення

2 х 8-контактні

Споживана потужність, Вт

300

Орієнтовна вартість, $

5999

http://www.techpowerup.com
http://www.amd.com
Сергій Буділовський

Постійне посилання на новину

Відеокарта ASUS Radeon R7 250 (R7250-2GD5) з підтримкою технології AUTO-EXTREME

На даний момент бюджетний сегмент ринку графічних адаптерів компанії AMD представляє лінійка AMD Radeon R7 200. Тому особливого подиву дебют моделі ASUS Radeon R7 250 (R7250-2GD5) не викликає. Вона побудована на основі графічного чипа AMD Oland XT і оснащена підтримкою 2 ГБ GDDR5-пам'яті, тому зможе використовуватися навіть невимогливими геймерами.

ASUS Radeon R7 250 R7250-2GD5

Базова тактова частота графічного процесора новинки становить 725 МГц. У динамічному режимі вони можуть підвищуватися до 925 МГц. У свою чергу відеопам'ять працює на ефективній частоті 4500 МГц. Для охолодження внутрішніх компонентів використовується доволі компактна система на основі алюмінієвого радіатора та одного осьового вентилятора з дизайном Dust-proof fan.

ASUS Radeon R7 250 R7250-2GD5

На особливу увагу в ASUS Radeon R7 250 (R7250-2GD5) заслуговує використання технології ASUS AUTO-EXTREME при її виробництві, а також застосування надійної елементної бази Super Alloy Power II. А до комплекту постачання новинки входить корисна фірмова утиліта GPU Tweak II. Детальніша таблиця технічної специфікації відеокарти ASUS Radeon R7 250 (R7250-2GD5):

Модель

ASUS Radeon R7 250 (R7250-2GD5)

GPU

AMD Oland XT

Мікроархітектура

AMD GCN

Техпроцес, нм

28

Кількість потокових процесорів

384

Кількість текстурних блоків

24

Кількість растрових блоків

8

Базова / динамічна тактова частота GPU, МГц

725 / 925

Тип відеопам'яті

GDDR5

Об’єм, ГБ

2

Номінальна / ефективна частота пам'яті, МГц

1125 / 4500

Ширина шини пам'яті, біт

128

Зовнішні інтерфейси

1 x DVI-I
1 x HDMI
1 x DisplayPort

Розміри, мм

168 x 121 x 37 мм

http://www.asus.com
Сергій Буділовський

Постійне посилання на новину

Показати ще