Комп'ютерні новини
Відеокарти
Фото та деякі характеристики GPU NVIDIA GP104 і NVIDIA GP106
Днями компанія NVIDIA презентувала флагманський графічний процесор NVIDIA GP100 і професійну відеокарту NVIDIA Tesla P100 на його основі. Тепер в інтернет проникли перші фото та подробиці менш продуктивних GPU, які будуть використані в масових відеокартах, призначених для користувачів.

Почнемо з NVIDIA GP104, який можна буде зустріти в моделях NVIDIA GeForce GTX 1070 і NVIDIA GeForce GTX 1080. Орієнтовна площа кристала становить 290 – 300 мм2, що на 100 мм2 менше, ніж у його попередника NVIDIA GM204 (398 мм2). При цьому кількість транзисторів зросла з 5,2 млрд. до 7,4 – 7,9 млрд. Шкода, що при цьому не уточнюють рівень TDP нових відеокарт.
За попередніми даними, NVIDIA GeForce GTX 1070 має в своєму складі 36 SM-блоків, тобто 2304 CUDA-ядер і 144 текстурних блоків. У NVIDIA GeForce GTX 1080 кількість SM-блоків збільшено до 40, у результаті маємо 2560 CUDA-ядер і 160 текстурних блоків. Для набору відеопам'яті обидві моделі використовують 8-гігабітні чіпи Samsung K4G80325FB-HC25 з 256-бітної шиною та ефективною частотою 8 ГГц.
У свою чергу NVIDIA GP106 характеризується ще меншою загальною площею (170 – 200 мм2). Нагадаємо, що у його попередника, NVIDIA GM206, цей показник сягав 227 мм2. Новинка буде використовуватися в відеокартах NVIDIA GeForce GTX 1050 і NVIDIA GeForce GTX 1060, оснащених 4 ГБ GDDR5-пам'яті. Найменшим графічним процесором у серії NVIDIA Pascal стане NVIDIA GP107, який стане основою бюджетних моделей.
Порівняльна таблиця технічної специфікації GPU NVIDIA GP104 і NVIDIA GP100:
|
GPU |
NVIDIA GM204 |
NVIDIA GP106 |
NVIDIA GP104 |
NVIDIA GP100 |
|
Відеокарти на його основі |
NVIDIA GeForce GTX 970 / NVIDIA GeForce GTX 980 |
NVIDIA GeForce GTX 1050 / NVIDIA GeForce GTX 1060 |
NVIDIA GeForce GTX 1070 / NVIDIA GeForce GTX 1080 |
NVIDIA Tesla P100 |
|
Мікроархітектура |
NVIDIA Maxwell |
NVIDIA Pascal |
NVIDIA Pascal |
NVIDIA Pascal |
|
Техпроцес, нм |
28 |
16 |
16 |
16 |
|
Площа GPU, мм2 |
398 |
170 – 200 |
290 – 300 |
610 |
|
Кількість транзисторів, млрд. |
5,2 |
- |
7,4 – 7,9 |
15,3 |
|
Кількість SM-модулів |
13 / 16 |
16 / 20 |
36 / 40 |
56 |
|
Кількість CUDA-ядер |
1664 / 2048 |
1024 / 1280 |
2304 / 2560 |
3584 |
|
Кількість текстурних блоків |
104 / 128 |
64 / 80 |
144 / 160 |
224 |
|
Тип відеопам’яті |
GDDR5 |
GDDR5 |
GDDR5 |
HBM2 |
|
Об’єм пам’яті, ГБ |
4 |
4 |
8 |
16 |
|
Розрядність шини, бітів |
256 |
128 / 256 |
256 |
4096 |
|
TDP, Вт |
145 / 165 |
- / - |
- / - |
300 |
http://wccftech.com
Сергій Буділовський
Можливі терміни появи AMD Polaris і NVIDIA Pascal
Схоже, що літо 2016 року буде дуже спекотним у сегменті графічних адаптерів. Відповідно до неофіційної інформації з джерел, близьких до виробників відеокарт, компанії AMD і NVIDIA намітили реліз нових продуктів саме на літо.
Повідомляється, що високопродуктивні відеокарти AMD Radeon R9 490 і AMD Radeon R9 490X, засновані на 14-нм мікроархітектурі AMD Polaris 10, можуть бути анонсовані вже в межах виставки Computex 2016 на початку червня. Повноцінний реліз очікується наприкінці червня, однак поки невідомо, чи надійдуть вони відразу в продаж. Справа в тому, що деякі джерела згадують про використання в них пам'яті GDDR5X, масове виробництво якої почнеться влітку.
У свою чергу компанія NVIDIA хоче ще швидше вивести на ринок свою 16-нм мікроархітектуру NVIDIA Pascal. Дебют продуктивних моделей NVIDIA GeForce GTX 1070 і NVIDIA GeForce GTX 1080 ймовірно відбудеться вже в кінці травня - на початку червня. На ринку вони з'являться в липні.
http://www.dvhardware.net
Сергій Буділовський
Терміни появи відеокарти AMD Radeon Pro Duo у продажі
У середині березня був представлений графічний адаптер AMD Radeon Pro Duo. Тепер же стало відомо, що у продаж він надійде з 26 квітня за орієнтовною вартістю $1499, тобто займе ціновий сегмент свого попередника – AMD Radeon R9 295X2. Партнери компанії AMD зможуть продавати новинку під власним брендом, але при цьому повинні використовувати референсний її дизайн. Тобто істотних змін у компонуванні друкованої плати або системи охолодження не передбачається.
Нагадаємо, що AMD Radeon Pro Duo в першу чергу призначена для використання у високопродуктивних ігрових системах, а також для перегляду та створення VR-контенту. Вона складається із двох графічних процесорів AMD Fiji XT, кожен з яких оснащений 4 ГБ HBM-пам'яті. Обчислювальна потужність подібного зв'язування досягає 16 TFLOPS. Однак для коректної роботи новинка вимагає підключення трьох 8-контактних конекторів PCIe, тому потужний блок живлення в такій системі є обов'язковим елементом.
Зведена таблиця технічної специфікації відеокарти AMD Radeon Pro Duo:
|
Модель |
AMD Radeon Pro Duo |
|
GPU |
2 х AMD Fiji XT |
|
Мікроархітектура |
AMD GCN |
|
Техпроцес, нм |
28 |
|
Кількість потокових процесорів |
8192 (2 x 4096) |
|
Кількість текстурних блоків |
512 (2 x 256) |
|
Кількість растрових блоків |
128 (2 x 64) |
|
Тактова частота GPU, МГц |
730 / 1000 |
|
Тип відеопам'яті |
HBM |
|
Об’єм, ГБ |
8 (2 x 4) |
|
Номінальна / ефективна частота пам'яті, МГц |
500 / 1000 |
|
Ширина шини пам'яті, біт |
8192 (2 x 4096) |
|
Пропускна здатність пам'яті, ГБ/с |
1024 (2 х 512) |
|
Внутрішній інтерфейс |
PCI Express 3.0 x16 |
|
Обчислювальна потужність, TFLOPS |
16 |
|
Додаткові роз’єми живлення PCIe |
3 x 8-контактні |
|
Орієнтовна вартість, $ |
1499 |
http://www.techpowerup.com
Сергій Буділовський
Детальний погляд на графічний процесор NVIDIA GP100 (Pascal)
Після офіційної презентації прискорювача NVIDIA Tesla P100 з'явилися дуже цікаві подробиці про використаний у ньому графічний процесор NVIDIA GP100. Оскільки це флагманський GPU серії NVIDIA Pascal, його конфігурація є максимальною. Тобто в звичайних масових відеокартах ми не побачимо більшої кількості структурних компонентів.
Офіційна блок-схема GPU NVIDIA GP100. Цікаво, що на діаграмі зображено 60 SM-блоків, хоча для NVIDIA GP100 заявлено лише 56
Почнемо з того, що перехід з 28-нм на 16-нм техпроцес дозволив компанії NVIDIA практично подвоїти кількість транзисторів (з 8 млрд. до 15,3 млрд.) У порівнянні з попереднім флагманом, зберігши загальну площу кристала практично незмінною (601 мм2 проти 610 мм2).
Друга важлива зміна стосується кількості структурних компонентів в одному SM-модулі. Мікроархітектура NVIDIA Maxwell передбачала використання 128 звичайних CUDA-ядер (FP32) і 4 CUDA-ядер для обчислень подвійної точності. В результаті загальна кількість цих структурних блоків у GPU NVIDIA GM200 становила 3072 і 96 відповідно. Мікроархітектура NVIDIA GP100 передбачає інтеграцію в кожен SM-модуль 64 звичайних CUDA-ядер і 32 CUDA-ядер для обчислень подвійної точності. Відповідно, максимальна загальна кількість перших досягне 3584, а других - 1792. Цим пояснюється величезний стрибок у швидкості обчислень подвійної точності: з 213 до 5304 GFLOPS.
Вразили й тактові частоти роботи графічного процесора NVIDIA GP100: в номінальному режимі вона становить 1328 МГц, а в динамічному сягає 1480 МГц. При цьому показник TDP новинки зріс на 50 Вт: з 250 до 300 Вт. Порівняльна таблиця технічної специфікації відеокарти NVIDIA Tesla P100 зі своїми попередниками:
|
Модель |
NVIDIA Tesla K40 |
NVIDIA Tesla M40 |
NVIDIA Tesla P100 |
|
GPU |
NVIDIA GK110 |
NVIDIA GM200 |
NVIDIA GP100 |
|
Мікроархітектура |
NVIDIA Kepler |
NVIDIA Maxwell |
NVIDIA Pascal |
|
Техпроцес, нм |
28 |
28 |
16 |
|
Площа GPU, мм2 |
551 |
601 |
610 |
|
Кількість транзисторів, млрд. |
7,1 |
8 |
15,3 |
|
Кількість SM-модулів |
15 |
24 |
56 |
|
Кількість CUDA-ядер |
2880 |
3072 |
3584 |
|
Кількість CUDA-ядер для обчислень подвійної точності |
960 |
96 |
1792 |
|
Кількість текстурних блоків |
240 |
192 |
224 |
|
Базова / динамічна тактова частота, МГц |
745 / 875 |
948 / 1114 |
1328 / 1480 |
|
Тип відеопам'яті |
GDDR5 |
GDDR5 |
HBM2 |
|
Об’єм пам’яті, ГБ |
12 |
24 |
16 |
|
Розрядність шини, бітів |
384 |
384 |
4096 |
|
Швидкість обчислень подвійної точності, GFLOPS |
1680 |
213 |
5304 |
|
TDP, Вт |
235 |
250 |
300 |
http://www.pcworld.com
Сергій Буділовський
Серія відеокарт EVGA GeForce GTX 950 Low Power включає до свого складу чотири моделі
Компанія EVGA презентувала відразу чотири нові відеокарти серії EVGA GeForce GTX 950 Low Power, ключовою перевагою яких є знижене енергоспоживання, тому для коректної роботи вони не вимагають підключення 6-контактного кабелю PCIe.
Також представлені новинки характеризуються компактними розмірами й одновентиляторною фірмовою системою охолодження ACX 2.0. У результаті вони відмінно підійдуть для використання в компактних середньопродуктивних ігрових системах.
Що ж стосується технічних характеристик, то базова та динамічна частоти графічного процесора моделей EVGA GeForce GTX 950 (02G-P4-0952) і EVGA GeForce GTX 950 (02G-P4-0954) знаходяться на рівні 1025 і 1190 МГц відповідно. У версіях EVGA GeForce GTX 950 SC (02G-P4-0956) і EVGA GeForce GTX 950 SC (02G-P4-0958) аналогічні показники становлять 1076 і 1253 МГц. А от підсистема оперативної пам'яті в них однакова – 2 ГБ GDDR5 з ефективною частотою 6608 МГц і 128-бітною шиною.
Порівняльна таблиця технічної специфікації відеокарт серії EVGA GeForce GTX 950 Low Power:
|
Модель |
EVGA GeForce GTX 950 (02G-P4-0952) |
EVGA GeForce GTX 950 (02G-P4-0954) |
EVGA GeForce GTX 950 SC (02G-P4-0956) |
EVGA GeForce GTX 950 SC (02G-P4-0958) |
|
GPU |
NVIDIA GM206-250 |
|||
|
Мікроархітектура |
NVIDIA Maxwell |
|||
|
Техпроцес, нм |
28 |
|||
|
Кількість CUDA-ядер |
768 |
|||
|
Кількість текстурних блоків |
48 |
|||
|
Кількість растрових блоків |
32 |
|||
|
Тактова частота GPU, МГц |
1025 / 1190 |
1076 / 1253 |
||
|
Тип відеопам'яті |
GDDR5 |
|||
|
Об’єм, ГБ |
2 |
|||
|
Номінальна / ефективна частота пам'яті, МГц |
1652 / 6608 |
|||
|
Ширина шини пам'яті, біт |
128 |
|||
|
Пропускна здатність пам'яті, ГБ/с |
105,73 |
|||
|
Зовнішні інтерфейси |
1 x DVI-I |
1 x DVI-I |
1 x DVI-I |
1 x DVI-I |
http://www.techpowerup.com
http://www.evga.com
Сергій Буділовський
NVIDIA на GTC 2016: анонс мікроархітектури NVIDIA Pascal і ряд інших інновацій
В каліфорнійському місті Сан-Хосе успішно стартувала GPU Technology Conference (GTC), у рамках якої компанія NVIDIA зробила ряд важливих анонсів своїх майбутніх продуктів. У першу чергу багатьох цікавить мікроархітектура NVIDIA Pascal, тому з неї й почнемо.
NVIDIA Tesla P100
Першим офіційним анонсом нової мікроархітектури стали не масові користувацькі відеокарти, а прискорювач для надмасштабованих дата-центрів − NVIDIA Tesla P100. З його допомогою можна створювати новий клас серверів із продуктивністю рівня кількох сотень класичних серверів на базі CPU. Потужності подібних рішень буде достатньо для нового покоління наукових додатків і завдань, пов'язаних зі штучним інтелектом, для яких потрібні надефективні, ультрашвидкісні серверні вузли.
Модель NVIDIA Tesla P100 використовує п'ять передових технологій для забезпечення високої продуктивності й ефективності використання ресурсів:
- Мікроархітектура NVIDIA Pascal підвищує швидкість навчання нейронних мереж в 12 разів у порівнянні з рішеннями на базі NVIDIA Maxwell.
- Високошвидкісний інтерфейс NVIDIA NVLink використовується для зв'язку між кількома графічними процесорами. Він більш ефективно розподіляє навантаження між GPU, збільшуючи пропускну здатність в 5 разів у порівнянні із кращими на сьогодні рішеннями в даному класі. NVIDIA NVLink дозволяє зв'язати до восьми GPU NVIDIA Tesla P100. IBM уже впровадила цей інтерфейс у свої процесори POWER8 для високошвидкісної комунікації між CPU і GPU.
- 16-нм FinFET-технологія дозволила інтегрувати в процесор 15,3 млрд. транзисторів, що гарантує найвищу продуктивність і енергоефективність.
- Інноваційний підхід до побудови пам'яті CHIP-ON-WAFER-ON-SUBSTRATE (CoWoS) з HBM2 підвищує пропускну здатність в 3 рази (до 720 ГБ/с) у порівнянні з архітектурою NVIDIA Maxwell.
- Нові алгоритми штучного інтелекту забезпечують пікову продуктивність понад 21 TFLOPS у завданнях глибокого навчання.
Використання прискорювача NVIDIA Tesla P100 дозволяє досягнути феноменальних результатів. Наприклад, додаток молекулярної динаміки AMBER працює швидше на одному сервері з NVIDIA Tesla P100, аніж на 48 звичайних двосокетних серверних вузлах. А для навчання популярної глибокої нейронної мережі AlexNet буде потрібно 250 двосокетних серверних вузлів, щоб досягнути продуктивності восьми GPU NVIDIA Tesla P100.
Ключові характеристики NVIDIA Tesla P100:
|
Модель |
NVIDIA Tesla P100 |
|
Тип пам'яті |
CoWoS HBM2 |
|
Об’єм пам'яті |
16 ГБ |
|
Смуга пропускання |
720 ГБ/с |
|
Інтерфейс |
Двонаправлений NVIDIA NVLink |
|
Пропускна здатність інтерфейсу |
160 ГБ/с |
|
Швидкість обчислень подвійної точності |
5,3 TFLOPS |
|
Швидкість обчислень одинарної точності |
10,6 TFLOPS |
|
Швидкість обчислень половинної точності |
21,2 TFLOPS |
|
Додаткові переваги |
Поліпшена програмованість із рушієм переходу по сторінках і уніфікованою пам'яттю |
Оновлення в NVIDIA SDK
Підвищена обчислювальна потужність і розширені функціональні можливості потребували оновлення платформи NVIDIA SDK. У число ключових змін входить NVIDIA CUDA 8. Новітня версія платформи паралельних обчислень NVIDIA надає розробникам прямий доступ до нових можливостей мікроархітектури NVIDIA Pascal, включаючи уніфіковану пам'ять та інтерфейс NVIDIA NVLink. Крім того, в актуальний реліз входить бібліотека аналізу графів nvGRAPH, яку можна використовувати для розрахунків траєкторій, інформаційної безпеки й аналізу логістики, яка включає в сферу застосування GPU-прискорених обчислень аналітику Big Data.
Для мереж глибокого навчання NVIDIA анонсувала GPU-прискорювану бібліотеку примітивів cuDNN версії 5. Вона включає в себе підтримку GPU NVIDIA Pascal, прискорення рекуррентних нейронних мереж, використовуваних для відео й інших послідовних даних, а також ряд поліпшень, призначених для застосування в медичній, нафтогазовій та інших областях промисловості. cuDNN прискорює роботу ведучих фреймворків глибокого навчання, включаючи TensorFlow від Google, Caffe від Університету Берклі, Theano від Університету Монреаля та Torch від Нью-Йоркського Університету, які, у свою чергу, знаходяться в основі рішень від Amazon, Facebook, Google та інших компаній.
NVIDIA DGX-1
NVIDIA DGX-1 – це перший у світі суперкомп'ютер для глибокого навчання, який має достатню обчислювальну потужність для розвитку штучного інтелекту (ШІ). Він розроблений спеціально для завдань глибокого навчання (Deep Learning). Система NVIDIA DGX-1 оснащена всім необхідним апаратним і програмним забезпеченням для глибокого навчання й інструментами розробки для швидкого та легкого розгортання.
В основі новинки знаходяться графічні прискорювачі NVIDIA Tesla P100 з високошвидкісним інтерфейсом NVIDIA NVLink і 16 ГБ пам'яті CoWoS HBM2. У результаті обчислювальну потужність NVIDIA DGX-1 можна зіставити з 250 традиційними серверами на базі CPU.
У свою чергу набір комплектного ПЗ містить у собі NVIDIA Deep Learning GPU Training System (DIGITS), повноцінну інтерактивну систему для створення глибоких нейронних мереж (DNN), а також NVIDIA CUDA Deep Neural Network (cuDNN) версії 5 − GPU-прискорювану бібліотеку примітивів для створення DNN.
В США системи глибокого навчання NVIDIA DGX-1 будуть доступні прямо в NVIDIA і у деяких партнерів у червні, в інших регіонах − у третьому кварталі поточного року. Також очікується, що прискорювач NVIDIA Tesla P100 з'явиться в складі серверів від провідних виробників на початку 2017 року.
Ключові характеристики системи NVIDIA DGX-1:
|
Назва |
NVIDIA DGX-1 |
|
Використовувані прискорювачі |
8 х NVIDIA Tesla P100 |
|
Об’єм пам'яті кожного прискорювача |
16 ГБ |
|
Інтерфейс |
NVLink Hybrid Cube Mesh |
|
Постійна пам'ять |
7 ТБ SSD |
|
Пікова продуктивність обчислень половинної точності |
170 TFLOPS |
|
Мережеві інтерфейси |
Dual 10 GbE, Quad InfiniBand 100Gb |
|
Формат |
3U |
|
Потужність |
3200 Вт |
http://www.nvidia.com
Сергій Буділовський
AMD FirePro S9300 x2 – перший у світі серверний графічний прискорювач із підтримкою HBM-пам'яті
Компанія AMD з гордістю представила свій флагманський графічний прискорювач для серверних систем – AMD FirePro S9300 x2. Він призначений для використання в складних обчислювальних завданнях, наприклад, для аналізу великих масивів даних, у сфері молекулярної динаміки, при вивченні астрономічних процесів, у глибоких нейронних мережах та інших.
Новинка побудована на основі двох GPU AMD Fiji у максимальній їхній конфігурації (4096 потокових процесорів у кожному), які працюють на частоті 850 МГц. Кожен з них використовує власні 4 ГБ HBM-пам'яті з ефективною частотою 1000 МГц і пропускною здатністю 512 ГБ/с. Завдяки цьому обчислювальна потужність досягає 13,9 TFLOPS, що суттєво вище конкурентних аналогів у вигляді NVIDIA Tesla K80 (5,6 TFLOPS) і NVIDIA Tesla M60 (7,4 TFLOPS).
Важливою перевагою AMD FirePro S9300 x2 є підтримка програмного стеку AMD GPUOpen, який реалізує апаратне прискорення програмного коду, написаного на C++ або OpenCL. У продаж новинка надійде в другому кварталі за орієнтовною вартістю $5999.
Зведена таблиця технічної специфікації графічного адаптера AMD FirePro S9300 x2:
|
Модель |
AMD FirePro S9300 x2 |
|
Використовувана мікроархітектура |
AMD GCN |
|
Кількість графічних процесорів |
2 |
|
Тип графічних процесорів |
AMD Fiji |
|
Кількість потокових процесорів |
2 x 4096 |
|
Тактова частота GPU, МГц |
850 |
|
Тип відеопам'яті |
HBM |
|
Об’єм, ГБ |
2 x 4 |
|
Базова / ефективна частота пам'яті, МГц |
500 / 1000 |
|
Пропускна здатність, ГБ/с |
2 х 512 |
|
Максимальна обчислювальна потужність (одинарна точність), TFLOPS |
13,9 |
|
Максимальна обчислювальна потужність (подвійна точність), GFLOPS |
870 |
|
Тип системи охолодження |
Двослотова, пасивна |
|
Внутрішній інтерфейс |
PCI Express 3.0 x16 |
|
Додаткові роз’єми живлення |
2 х 8-контактні |
|
Споживана потужність, Вт |
300 |
|
Орієнтовна вартість, $ |
5999 |
http://www.techpowerup.com
http://www.amd.com
Сергій Буділовський
Відеокарта ASUS Radeon R7 250 (R7250-2GD5) з підтримкою технології AUTO-EXTREME
На даний момент бюджетний сегмент ринку графічних адаптерів компанії AMD представляє лінійка AMD Radeon R7 200. Тому особливого подиву дебют моделі ASUS Radeon R7 250 (R7250-2GD5) не викликає. Вона побудована на основі графічного чипа AMD Oland XT і оснащена підтримкою 2 ГБ GDDR5-пам'яті, тому зможе використовуватися навіть невимогливими геймерами.
Базова тактова частота графічного процесора новинки становить 725 МГц. У динамічному режимі вони можуть підвищуватися до 925 МГц. У свою чергу відеопам'ять працює на ефективній частоті 4500 МГц. Для охолодження внутрішніх компонентів використовується доволі компактна система на основі алюмінієвого радіатора та одного осьового вентилятора з дизайном Dust-proof fan.
На особливу увагу в ASUS Radeon R7 250 (R7250-2GD5) заслуговує використання технології ASUS AUTO-EXTREME при її виробництві, а також застосування надійної елементної бази Super Alloy Power II. А до комплекту постачання новинки входить корисна фірмова утиліта GPU Tweak II. Детальніша таблиця технічної специфікації відеокарти ASUS Radeon R7 250 (R7250-2GD5):
|
Модель |
ASUS Radeon R7 250 (R7250-2GD5) |
|
GPU |
AMD Oland XT |
|
Мікроархітектура |
AMD GCN |
|
Техпроцес, нм |
28 |
|
Кількість потокових процесорів |
384 |
|
Кількість текстурних блоків |
24 |
|
Кількість растрових блоків |
8 |
|
Базова / динамічна тактова частота GPU, МГц |
725 / 925 |
|
Тип відеопам'яті |
GDDR5 |
|
Об’єм, ГБ |
2 |
|
Номінальна / ефективна частота пам'яті, МГц |
1125 / 4500 |
|
Ширина шини пам'яті, біт |
128 |
|
Зовнішні інтерфейси |
1 x DVI-I |
|
Розміри, мм |
168 x 121 x 37 мм |
http://www.asus.com
Сергій Буділовський
Показати ще




























