Комп'ютерні новини

Відеокарти

09-04-2016 11:49

Фото та деякі характеристики GPU NVIDIA GP104 і NVIDIA GP106

Днями компанія NVIDIA презентувала флагманський графічний процесор NVIDIA GP100 і професійну відеокарту NVIDIA Tesla P100 на його основі. Тепер в інтернет проникли перші фото та подробиці менш продуктивних GPU, які будуть використані в масових відеокартах, призначених для користувачів.

NVIDIA GP104

Почнемо з NVIDIA GP104, який можна буде зустріти в моделях NVIDIA GeForce GTX 1070 і NVIDIA GeForce GTX 1080. Орієнтовна площа кристала становить 290 – 300 мм², що на 100 мм² менше, ніж у його попередника NVIDIA GM204 (398 мм²). При цьому кількість транзисторів зросла з 5,2 млрд. до 7,4 – 7,9 млрд. Шкода, що при цьому не уточнюють рівень TDP нових відеокарт.

За попередніми даними, NVIDIA GeForce GTX 1070 має в своєму складі 36 SM-блоків, тобто 2304 CUDA-ядер і 144 текстурних блоків. У NVIDIA GeForce GTX 1080 кількість SM-блоків збільшено до 40, у результаті маємо 2560 CUDA-ядер і 160 текстурних блоків. Для набору відеопам'яті обидві моделі використовують 8-гігабітні чіпи Samsung K4G80325FB-HC25 з 256-бітної шиною та ефективною частотою 8 ГГц.

У свою чергу NVIDIA GP106 характеризується ще меншою загальною площею (170 – 200 мм²). Нагадаємо, що у його попередника, NVIDIA GM206, цей показник сягав 227 мм². Новинка буде використовуватися в відеокартах NVIDIA GeForce GTX 1050 і NVIDIA GeForce GTX 1060, оснащених 4 ГБ GDDR5-пам'яті. Найменшим графічним процесором у серії NVIDIA Pascal стане NVIDIA GP107, який стане основою бюджетних моделей.

Порівняльна таблиця технічної специфікації GPU NVIDIA GP104 і NVIDIA GP100:

GPU	NVIDIA GM204	NVIDIA GP106	NVIDIA GP104	NVIDIA GP100
Відеокарти на його основі	NVIDIA GeForce GTX 970 / NVIDIA GeForce GTX 980	NVIDIA GeForce GTX 1050 / NVIDIA GeForce GTX 1060	NVIDIA GeForce GTX 1070 / NVIDIA GeForce GTX 1080	NVIDIA Tesla P100
Мікроархітектура	NVIDIA Maxwell	NVIDIA Pascal	NVIDIA Pascal	NVIDIA Pascal
Техпроцес, нм	28	16	16	16
Площа GPU, мм²	398	170 – 200	290 – 300	610
Кількість транзисторів, млрд.	5,2	-	7,4 – 7,9	15,3
Кількість SM-модулів	13 / 16	16 / 20	36 / 40	56
Кількість CUDA-ядер	1664 / 2048	1024 / 1280	2304 / 2560	3584
Кількість текстурних блоків	104 / 128	64 / 80	144 / 160	224
Тип відеопам’яті	GDDR5	GDDR5	GDDR5	HBM2
Об’єм пам’яті, ГБ	4	4	8	16
Розрядність шини, бітів	256	128 / 256	256	4096
TDP, Вт	145 / 165	- / -	- / -	300

http://wccftech.com
Сергій Буділовський

Постійне посилання на новину

08-04-2016 15:28

Можливі терміни появи AMD Polaris і NVIDIA Pascal

Схоже, що літо 2016 року буде дуже спекотним у сегменті графічних адаптерів. Відповідно до неофіційної інформації з джерел, близьких до виробників відеокарт, компанії AMD і NVIDIA намітили реліз нових продуктів саме на літо.

Повідомляється, що високопродуктивні відеокарти AMD Radeon R9 490 і AMD Radeon R9 490X, засновані на 14-нм мікроархітектурі AMD Polaris 10, можуть бути анонсовані вже в межах виставки Computex 2016 на початку червня. Повноцінний реліз очікується наприкінці червня, однак поки невідомо, чи надійдуть вони відразу в продаж. Справа в тому, що деякі джерела згадують про використання в них пам'яті GDDR5X, масове виробництво якої почнеться влітку.

У свою чергу компанія NVIDIA хоче ще швидше вивести на ринок свою 16-нм мікроархітектуру NVIDIA Pascal. Дебют продуктивних моделей NVIDIA GeForce GTX 1070 і NVIDIA GeForce GTX 1080 ймовірно відбудеться вже в кінці травня - на початку червня. На ринку вони з'являться в липні.

http://www.dvhardware.net
Сергій Буділовський

Постійне посилання на новину

08-04-2016 08:36

Терміни появи відеокарти AMD Radeon Pro Duo у продажі

У середині березня був представлений графічний адаптер AMD Radeon Pro Duo. Тепер же стало відомо, що у продаж він надійде з 26 квітня за орієнтовною вартістю $1499, тобто займе ціновий сегмент свого попередника – AMD Radeon R9 295X2. Партнери компанії AMD зможуть продавати новинку під власним брендом, але при цьому повинні використовувати референсний її дизайн. Тобто істотних змін у компонуванні друкованої плати або системи охолодження не передбачається.

Нагадаємо, що AMD Radeon Pro Duo в першу чергу призначена для використання у високопродуктивних ігрових системах, а також для перегляду та створення VR-контенту. Вона складається із двох графічних процесорів AMD Fiji XT, кожен з яких оснащений 4 ГБ HBM-пам'яті. Обчислювальна потужність подібного зв'язування досягає 16 TFLOPS. Однак для коректної роботи новинка вимагає підключення трьох 8-контактних конекторів PCIe, тому потужний блок живлення в такій системі є обов'язковим елементом.

Зведена таблиця технічної специфікації відеокарти AMD Radeon Pro Duo:

Модель	AMD Radeon Pro Duo
GPU	2 х AMD Fiji XT
Мікроархітектура	AMD GCN
Техпроцес, нм	28
Кількість потокових процесорів	8192 (2 x 4096)
Кількість текстурних блоків	512 (2 x 256)
Кількість растрових блоків	128 (2 x 64)
Тактова частота GPU, МГц	730 / 1000
Тип відеопам'яті	HBM
Об’єм, ГБ	8 (2 x 4)
Номінальна / ефективна частота пам'яті, МГц	500 / 1000
Ширина шини пам'яті, біт	8192 (2 x 4096)
Пропускна здатність пам'яті, ГБ/с	1024 (2 х 512)
Внутрішній інтерфейс	PCI Express 3.0 x16
Обчислювальна потужність, TFLOPS	16
Додаткові роз’єми живлення PCIe	3 x 8-контактні
Орієнтовна вартість, $	1499

http://www.techpowerup.com
Сергій Буділовський

Постійне посилання на новину

06-04-2016 12:21

Детальний погляд на графічний процесор NVIDIA GP100 (Pascal)

Після офіційної презентації прискорювача NVIDIA Tesla P100 з'явилися дуже цікаві подробиці про використаний у ньому графічний процесор NVIDIA GP100. Оскільки це флагманський GPU серії NVIDIA Pascal, його конфігурація є максимальною. Тобто в звичайних масових відеокартах ми не побачимо більшої кількості структурних компонентів.

Офіційна блок-схема GPU NVIDIA GP100. Цікаво, що на діаграмі зображено 60 SM-блоків, хоча для NVIDIA GP100 заявлено лише 56

Почнемо з того, що перехід з 28-нм на 16-нм техпроцес дозволив компанії NVIDIA практично подвоїти кількість транзисторів (з 8 млрд. до 15,3 млрд.) У порівнянні з попереднім флагманом, зберігши загальну площу кристала практично незмінною (601 мм² проти 610 мм²).

Друга важлива зміна стосується кількості структурних компонентів в одному SM-модулі. Мікроархітектура NVIDIA Maxwell передбачала використання 128 звичайних CUDA-ядер (FP32) і 4 CUDA-ядер для обчислень подвійної точності. В результаті загальна кількість цих структурних блоків у GPU NVIDIA GM200 становила 3072 і 96 відповідно. Мікроархітектура NVIDIA GP100 передбачає інтеграцію в кожен SM-модуль 64 звичайних CUDA-ядер і 32 CUDA-ядер для обчислень подвійної точності. Відповідно, максимальна загальна кількість перших досягне 3584, а других - 1792. Цим пояснюється величезний стрибок у швидкості обчислень подвійної точності: з 213 до 5304 GFLOPS.

Вразили й тактові частоти роботи графічного процесора NVIDIA GP100: в номінальному режимі вона становить 1328 МГц, а в динамічному сягає 1480 МГц. При цьому показник TDP новинки зріс на 50 Вт: з 250 до 300 Вт. Порівняльна таблиця технічної специфікації відеокарти NVIDIA Tesla P100 зі своїми попередниками:

Модель	NVIDIA Tesla K40	NVIDIA Tesla M40	NVIDIA Tesla P100
GPU	NVIDIA GK110	NVIDIA GM200	NVIDIA GP100
Мікроархітектура	NVIDIA Kepler	NVIDIA Maxwell	NVIDIA Pascal
Техпроцес, нм	28	28	16
Площа GPU, мм²	551	601	610
Кількість транзисторів, млрд.	7,1	8	15,3
Кількість SM-модулів	15	24	56
Кількість CUDA-ядер	2880	3072	3584
Кількість CUDA-ядер для обчислень подвійної точності	960	96	1792
Кількість текстурних блоків	240	192	224
Базова / динамічна тактова частота, МГц	745 / 875	948 / 1114	1328 / 1480
Тип відеопам'яті	GDDR5	GDDR5	HBM2
Об’єм пам’яті, ГБ	12	24	16
Розрядність шини, бітів	384	384	4096
Швидкість обчислень подвійної точності, GFLOPS	1680	213	5304
TDP, Вт	235	250	300

http://www.pcworld.com
Сергій Буділовський

Постійне посилання на новину

06-04-2016 09:50

Серія відеокарт EVGA GeForce GTX 950 Low Power включає до свого складу чотири моделі

Компанія EVGA презентувала відразу чотири нові відеокарти серії EVGA GeForce GTX 950 Low Power, ключовою перевагою яких є знижене енергоспоживання, тому для коректної роботи вони не вимагають підключення 6-контактного кабелю PCIe.

Також представлені новинки характеризуються компактними розмірами й одновентиляторною фірмовою системою охолодження ACX 2.0. У результаті вони відмінно підійдуть для використання в компактних середньопродуктивних ігрових системах.

Що ж стосується технічних характеристик, то базова та динамічна частоти графічного процесора моделей EVGA GeForce GTX 950 (02G-P4-0952) і EVGA GeForce GTX 950 (02G-P4-0954) знаходяться на рівні 1025 і 1190 МГц відповідно. У версіях EVGA GeForce GTX 950 SC (02G-P4-0956) і EVGA GeForce GTX 950 SC (02G-P4-0958) аналогічні показники становлять 1076 і 1253 МГц. А от підсистема оперативної пам'яті в них однакова – 2 ГБ GDDR5 з ефективною частотою 6608 МГц і 128-бітною шиною.

Порівняльна таблиця технічної специфікації відеокарт серії EVGA GeForce GTX 950 Low Power:

Модель	EVGA GeForce GTX 950 (02G-P4-0952)	EVGA GeForce GTX 950 (02G-P4-0954)	EVGA GeForce GTX 950 SC (02G-P4-0956)	EVGA GeForce GTX 950 SC (02G-P4-0958)
GPU	NVIDIA GM206-250
Мікроархітектура	NVIDIA Maxwell
Техпроцес, нм	28
Кількість CUDA-ядер	768
Кількість текстурних блоків	48
Кількість растрових блоків	32
Тактова частота GPU, МГц	1025 / 1190		1076 / 1253
Тип відеопам'яті	GDDR5
Об’єм, ГБ	2
Номінальна / ефективна частота пам'яті, МГц	1652 / 6608
Ширина шини пам'яті, біт	128
Пропускна здатність пам'яті, ГБ/с	105,73
Зовнішні інтерфейси	1 x DVI-I 1 x HDMI 1 x DisplayPort	1 x DVI-I 1 x DVI-D 1 x HDMI 1 x DisplayPort	1 x DVI-I 1 x HDMI 1 x DisplayPort	1 x DVI-I 1 x DVI-D 1 x HDMI 1 x DisplayPort

http://www.techpowerup.com
http://www.evga.com
Сергій Буділовський

Постійне посилання на новину

06-04-2016 09:18

NVIDIA на GTC 2016: анонс мікроархітектури NVIDIA Pascal і ряд інших інновацій

В каліфорнійському місті Сан-Хосе успішно стартувала GPU Technology Conference (GTC), у рамках якої компанія NVIDIA зробила ряд важливих анонсів своїх майбутніх продуктів. У першу чергу багатьох цікавить мікроархітектура NVIDIA Pascal, тому з неї й почнемо.

NVIDIA Tesla P100

Першим офіційним анонсом нової мікроархітектури стали не масові користувацькі відеокарти, а прискорювач для надмасштабованих дата-центрів − NVIDIA Tesla P100. З його допомогою можна створювати новий клас серверів із продуктивністю рівня кількох сотень класичних серверів на базі CPU. Потужності подібних рішень буде достатньо для нового покоління наукових додатків і завдань, пов'язаних зі штучним інтелектом, для яких потрібні надефективні, ультрашвидкісні серверні вузли.

Модель NVIDIA Tesla P100 використовує п'ять передових технологій для забезпечення високої продуктивності й ефективності використання ресурсів:

Мікроархітектура NVIDIA Pascal підвищує швидкість навчання нейронних мереж в 12 разів у порівнянні з рішеннями на базі NVIDIA Maxwell.
Високошвидкісний інтерфейс NVIDIA NVLink використовується для зв'язку між кількома графічними процесорами. Він більш ефективно розподіляє навантаження між GPU, збільшуючи пропускну здатність в 5 разів у порівнянні із кращими на сьогодні рішеннями в даному класі. NVIDIA NVLink дозволяє зв'язати до восьми GPU NVIDIA Tesla P100. IBM уже впровадила цей інтерфейс у свої процесори POWER8 для високошвидкісної комунікації між CPU і GPU.
16-нм FinFET-технологія дозволила інтегрувати в процесор 15,3 млрд. транзисторів, що гарантує найвищу продуктивність і енергоефективність.
Інноваційний підхід до побудови пам'яті CHIP-ON-WAFER-ON-SUBSTRATE (CoWoS) з HBM2 підвищує пропускну здатність в 3 рази (до 720 ГБ/с) у порівнянні з архітектурою NVIDIA Maxwell.
Нові алгоритми штучного інтелекту забезпечують пікову продуктивність понад 21 TFLOPS у завданнях глибокого навчання.

Використання прискорювача NVIDIA Tesla P100 дозволяє досягнути феноменальних результатів. Наприклад, додаток молекулярної динаміки AMBER працює швидше на одному сервері з NVIDIA Tesla P100, аніж на 48 звичайних двосокетних серверних вузлах. А для навчання популярної глибокої нейронної мережі AlexNet буде потрібно 250 двосокетних серверних вузлів, щоб досягнути продуктивності восьми GPU NVIDIA Tesla P100.

Ключові характеристики NVIDIA Tesla P100:

Модель	NVIDIA Tesla P100
Тип пам'яті	CoWoS HBM2
Об’єм пам'яті	16 ГБ
Смуга пропускання	720 ГБ/с
Інтерфейс	Двонаправлений NVIDIA NVLink
Пропускна здатність інтерфейсу	160 ГБ/с
Швидкість обчислень подвійної точності	5,3 TFLOPS
Швидкість обчислень одинарної точності	10,6 TFLOPS
Швидкість обчислень половинної точності	21,2 TFLOPS
Додаткові переваги	Поліпшена програмованість із рушієм переходу по сторінках і уніфікованою пам'яттю Захист ECC для підвищеної надійності Оптимізація під сервер для високої пропускної здатності та надійності дата-центру

Оновлення в NVIDIA SDK

Підвищена обчислювальна потужність і розширені функціональні можливості потребували оновлення платформи NVIDIA SDK. У число ключових змін входить NVIDIA CUDA 8. Новітня версія платформи паралельних обчислень NVIDIA надає розробникам прямий доступ до нових можливостей мікроархітектури NVIDIA Pascal, включаючи уніфіковану пам'ять та інтерфейс NVIDIA NVLink. Крім того, в актуальний реліз входить бібліотека аналізу графів nvGRAPH, яку можна використовувати для розрахунків траєкторій, інформаційної безпеки й аналізу логістики, яка включає в сферу застосування GPU-прискорених обчислень аналітику Big Data.

Для мереж глибокого навчання NVIDIA анонсувала GPU-прискорювану бібліотеку примітивів cuDNN версії 5. Вона включає в себе підтримку GPU NVIDIA Pascal, прискорення рекуррентних нейронних мереж, використовуваних для відео й інших послідовних даних, а також ряд поліпшень, призначених для застосування в медичній, нафтогазовій та інших областях промисловості. cuDNN прискорює роботу ведучих фреймворків глибокого навчання, включаючи TensorFlow від Google, Caffe від Університету Берклі, Theano від Університету Монреаля та Torch від Нью-Йоркського Університету, які, у свою чергу, знаходяться в основі рішень від Amazon, Facebook, Google та інших компаній.

NVIDIA DGX-1

NVIDIA DGX-1 – це перший у світі суперкомп'ютер для глибокого навчання, який має достатню обчислювальну потужність для розвитку штучного інтелекту (ШІ). Він розроблений спеціально для завдань глибокого навчання (Deep Learning). Система NVIDIA DGX-1 оснащена всім необхідним апаратним і програмним забезпеченням для глибокого навчання й інструментами розробки для швидкого та легкого розгортання.

В основі новинки знаходяться графічні прискорювачі NVIDIA Tesla P100 з високошвидкісним інтерфейсом NVIDIA NVLink і 16 ГБ пам'яті CoWoS HBM2. У результаті обчислювальну потужність NVIDIA DGX-1 можна зіставити з 250 традиційними серверами на базі CPU.

У свою чергу набір комплектного ПЗ містить у собі NVIDIA Deep Learning GPU Training System (DIGITS), повноцінну інтерактивну систему для створення глибоких нейронних мереж (DNN), а також NVIDIA CUDA Deep Neural Network (cuDNN) версії 5 − GPU-прискорювану бібліотеку примітивів для створення DNN.

В США системи глибокого навчання NVIDIA DGX-1 будуть доступні прямо в NVIDIA і у деяких партнерів у червні, в інших регіонах − у третьому кварталі поточного року. Також очікується, що прискорювач NVIDIA Tesla P100 з'явиться в складі серверів від провідних виробників на початку 2017 року.

Ключові характеристики системи NVIDIA DGX-1:

Назва	NVIDIA DGX-1
Використовувані прискорювачі	8 х NVIDIA Tesla P100
Об’єм пам'яті кожного прискорювача	16 ГБ
Інтерфейс	NVLink Hybrid Cube Mesh
Постійна пам'ять	7 ТБ SSD
Пікова продуктивність обчислень половинної точності	170 TFLOPS
Мережеві інтерфейси	Dual 10 GbE, Quad InfiniBand 100Gb
Формат	3U
Потужність	3200 Вт

http://www.nvidia.com
Сергій Буділовський

Постійне посилання на новину

01-04-2016 16:09

AMD FirePro S9300 x2 – перший у світі серверний графічний прискорювач із підтримкою HBM-пам'яті

Компанія AMD з гордістю представила свій флагманський графічний прискорювач для серверних систем – AMD FirePro S9300 x2. Він призначений для використання в складних обчислювальних завданнях, наприклад, для аналізу великих масивів даних, у сфері молекулярної динаміки, при вивченні астрономічних процесів, у глибоких нейронних мережах та інших.

Новинка побудована на основі двох GPU AMD Fiji у максимальній їхній конфігурації (4096 потокових процесорів у кожному), які працюють на частоті 850 МГц. Кожен з них використовує власні 4 ГБ HBM-пам'яті з ефективною частотою 1000 МГц і пропускною здатністю 512 ГБ/с. Завдяки цьому обчислювальна потужність досягає 13,9 TFLOPS, що суттєво вище конкурентних аналогів у вигляді NVIDIA Tesla K80 (5,6 TFLOPS) і NVIDIA Tesla M60 (7,4 TFLOPS).

Важливою перевагою AMD FirePro S9300 x2 є підтримка програмного стеку AMD GPUOpen, який реалізує апаратне прискорення програмного коду, написаного на C++ або OpenCL. У продаж новинка надійде в другому кварталі за орієнтовною вартістю $5999.

Зведена таблиця технічної специфікації графічного адаптера AMD FirePro S9300 x2:

Модель	AMD FirePro S9300 x2
Використовувана мікроархітектура	AMD GCN
Кількість графічних процесорів	2
Тип графічних процесорів	AMD Fiji
Кількість потокових процесорів	2 x 4096
Тактова частота GPU, МГц	850
Тип відеопам'яті	HBM
Об’єм, ГБ	2 x 4
Базова / ефективна частота пам'яті, МГц	500 / 1000
Пропускна здатність, ГБ/с	2 х 512
Максимальна обчислювальна потужність (одинарна точність), TFLOPS	13,9
Максимальна обчислювальна потужність (подвійна точність), GFLOPS	870
Тип системи охолодження	Двослотова, пасивна
Внутрішній інтерфейс	PCI Express 3.0 x16
Додаткові роз’єми живлення	2 х 8-контактні
Споживана потужність, Вт	300
Орієнтовна вартість, $	5999

http://www.techpowerup.com
http://www.amd.com
Сергій Буділовський

Постійне посилання на новину

29-03-2016 14:27

Відеокарта ASUS Radeon R7 250 (R7250-2GD5) з підтримкою технології AUTO-EXTREME

На даний момент бюджетний сегмент ринку графічних адаптерів компанії AMD представляє лінійка AMD Radeon R7 200. Тому особливого подиву дебют моделі ASUS Radeon R7 250 (R7250-2GD5) не викликає. Вона побудована на основі графічного чипа AMD Oland XT і оснащена підтримкою 2 ГБ GDDR5-пам'яті, тому зможе використовуватися навіть невимогливими геймерами.

Базова тактова частота графічного процесора новинки становить 725 МГц. У динамічному режимі вони можуть підвищуватися до 925 МГц. У свою чергу відеопам'ять працює на ефективній частоті 4500 МГц. Для охолодження внутрішніх компонентів використовується доволі компактна система на основі алюмінієвого радіатора та одного осьового вентилятора з дизайном Dust-proof fan.

На особливу увагу в ASUS Radeon R7 250 (R7250-2GD5) заслуговує використання технології ASUS AUTO-EXTREME при її виробництві, а також застосування надійної елементної бази Super Alloy Power II. А до комплекту постачання новинки входить корисна фірмова утиліта GPU Tweak II. Детальніша таблиця технічної специфікації відеокарти ASUS Radeon R7 250 (R7250-2GD5):

Модель	ASUS Radeon R7 250 (R7250-2GD5)
GPU	AMD Oland XT
Мікроархітектура	AMD GCN
Техпроцес, нм	28
Кількість потокових процесорів	384
Кількість текстурних блоків	24
Кількість растрових блоків	8
Базова / динамічна тактова частота GPU, МГц	725 / 925
Тип відеопам'яті	GDDR5
Об’єм, ГБ	2
Номінальна / ефективна частота пам'яті, МГц	1125 / 4500
Ширина шини пам'яті, біт	128
Зовнішні інтерфейси	1 x DVI-I 1 x HDMI 1 x DisplayPort
Розміри, мм	168 x 121 x 37 мм

http://www.asus.com
Сергій Буділовський

Постійне посилання на новину

Показати ще

Пошук по сайту

Комп'ютерні новини

Відеокарти

Фото та деякі характеристики GPU NVIDIA GP104 і NVIDIA GP106

Можливі терміни появи AMD Polaris і NVIDIA Pascal

Терміни появи відеокарти AMD Radeon Pro Duo у продажі

Детальний погляд на графічний процесор NVIDIA GP100 (Pascal)

Серія відеокарт EVGA GeForce GTX 950 Low Power включає до свого складу чотири моделі

NVIDIA на GTC 2016: анонс мікроархітектури NVIDIA Pascal і ряд інших інновацій

AMD FirePro S9300 x2 – перший у світі серверний графічний прискорювач із підтримкою HBM-пам'яті

Відеокарта ASUS Radeon R7 250 (R7250-2GD5) з підтримкою технології AUTO-EXTREME