Огляд і тестування відеокарти ASUS Dual GeForce RTX 2080 OC edition: крок у майбутнє
05-10-2018
Наприкінці літа NVIDIA зробила те, що від неї очікували з початку весни - офіційно анонсувала нову лінійку відеокарт. На думку компанії, вона настільки інноваційна, що навіть заслуговує нової приставки «RTX» замість звичної «GTX». Перші її представники вже надійшли до продажу, що дозволило і нам отримати модель для тестів. Але для початку трохи теорії.
Для більш зручного сприйняття інформації наводимо зведену таблицю відеокарт NVIDIA:
Модель |
NVIDIA GeForce GTX 1070 |
NVIDIA GeForce RTX 2070 |
NVIDIA GeForce GTX 1080 |
NVIDIA GeForce RTX 2080 |
NVIDIA GeForce GTX 1080 Ti |
NVIDIA GeForce RTX 2080 Ti |
Техпроцес, нм |
16 (FinFET) |
12 (FFN) |
16 (FinFET) |
12 (FFN) |
16 (FinFET) |
12 (FFN) |
GPU |
NVIDIA GP104-200 |
NVIDIA TU106 |
NVIDIA GP104-400 |
NVIDIA TU104-400A |
NVIDIA GP102-350 |
NVIDIA TU102-300A |
Мікроархітектура |
NVIDIA Pascal |
NVIDIA Turing |
NVIDIA Pascal |
NVIDIA Turing |
NVIDIA Pascal |
NVIDIA Turing |
Площа кристала, мм2 |
314 |
445 |
314 |
545 |
471 |
754 |
Кількість транзисторів, млрд. |
7,2 |
10,8 |
7,2 |
13,6 |
12 |
18,6 |
Кількість SM-блоків |
15 |
36 |
20 |
46 |
28 |
68 |
Кількість CUDA-ядер |
1920 |
2304 |
2560 |
2944 |
3584 |
4352 |
Кількість CUDA-ядер в SM-блоці |
128 |
64 |
128 |
64 |
128 |
64 |
Кількість текстурних блоків |
120 |
144 |
160 |
184 |
224 |
272 |
Кількість растрових блоків |
64 |
64 |
64 |
64 |
88 |
88 |
Кількість ядер Tensor |
- |
288 |
- |
368 |
- |
544 |
Кількість ядер RT |
- |
36 |
- |
46 |
- |
68 |
Об'єм кеша L2, КБ |
2048 |
4096 |
2048 |
4096 |
3072 |
6144 |
Базова / динамічна частота GPU, МГц |
1506 / 1683 |
1410 / 1620 |
1607 / 1733 |
1515 / 1710 |
1480 / 1582 |
1350 / 1545 |
Базова / динамічна частота GPU Founders Edition, МГц |
1506 / 1683 |
1410 / 1710 |
1607 / 1733 |
1515 / 1800 |
1480 / 1582 |
1350 / 1635 |
Тип відеопам'яті |
GDDR5 |
GDDR6 |
GDDR5X |
GDDR6 |
GDDR5X |
GDDR6 |
Обсяг, ГБ |
8 |
8 |
8 |
8 |
11 |
11 |
Ефективна частота пам'яті, МГц |
8 008 |
14 000 |
10 008 |
14 000 |
11 008 |
14 000 |
Розрядність шини, біт |
256 |
256 |
256 |
256 |
352 |
352 |
Пропускна здатність, ГБ/с |
256,3 |
448 |
320 |
448 |
484 |
616 |
Обчислювальна потужність FP32 (Founders Edition), TFLOPS |
6,5 |
7,5 (7,9) |
8,9 |
10 (10,6) |
11,3 |
13,4 (14,2) |
TDP (Founders Edition), Вт |
150 |
175 (185) |
180 |
215 (225) |
250 |
250 (260) |
Рекомендована вартість на старті продажів (партнерські / Founders Edition), $ |
379 / 449 |
499 / 599 |
599 / 699 |
699 / 799 |
699 |
999 / 1199 |
Ми розуміємо, що викладаємо огляд новинки із запізненням, тому немає особливого сенсу в глибокому зануренні в мікроархітектурні особливості: кому цікаво - уже прочитав усі подробиці на інших ресурсах, а кому не цікаво - усе одно пропустить цей блок і відразу перейде до знайомства з відеокартою. Тому лише коротко зупинимося на основних інноваціях.
Техпроцес
На папері бачимо перехід від 16-нм технології до 12-нм, але виробник самих чіпів, компанія TSMC, відкрито заявляє, що її техпроцес 12-нм FFN є злегка покращеною версією 16-нм FinFET+. Тому в реальності щільність розміщення транзисторів зросла незначно. Наприклад, для NVIDIA TU104 вона збільшилася на 9% порівняно з NVIDIA GP104. Основне ж зростання числа транзисторів відбулося завдяки збільшенню загальної площі кристалів.
Мікроархітектура
Блок-схема графічного процесора NVIDIA TU104
Важливі зміни торкнулися розподілу структурних блоків усередині графічного процесора. Як і раніше в основі знаходяться обчислювальні кластери GPC (Graphics Processing Cluster), але в порівнянні з NVIDIA Pascal маємо ряд нововведень:
- кожен SM-модуль усередині GPC отримав по одному ядру RT;
- кожен SM-модуль усередині GPC отримав по 8 тензорних ядер (Tensor);
- кількість CUDA-ядер у кожному SM-модулі зменшилася з 128 до 64;
- з'явилася можливість одночасного паралельного виконання операцій із цілочисельними (INT32) і речовими (FP32) даними, хоча раніше обчислювальні блоки були універсальними, тому за такт оброблялися або перші, або другі дані;
- у 2 рази збільшився обсяг кеш-пам'яті L2;
- до 2,7 разів виріс обсяг кеш-пам'яті L1, у 2 рази збільшилася її пропускна здатність і істотно знизилася затримка доступу.
Тензорні ядра
Тензорні ядра (Tensor Core) у мікроархітектурі Turing використовуються для перемноження двох матриць розміром 4х4 і складання отриманого результату з третьою матрицею аналогічного розміру. При цьому самі матриці можуть містити цілі числа або числа з комою. Ця проста на вигляд операція лежить в основі навчання нейронних мереж.
В іграх на основі тензорних ядер буде реалізована технологія згладжування Deep Learning Super Sampling (DLSS). За рівнем якості фінального зображення вона перевершує 64-кратне MSAA, але при цьому створює менше навантаження на систему. Однак підтримку DLSS необхідно реалізувати ще й на рівні ігор. Якщо така є, то істотно підвищується швидкість відеоряду.
RT-ядра
Трасування променів у режимі реального часу - це не новинка. Вона вже багато років використовується в архітектурі для створення фотореалістичних інтерактивних проектів будівель або інтер'єрів. Також її активно застосовують у кіноіндустрії, але там рендеринг кожного кадру займає багато часу і вимагає великого обсягу обчислювальних ресурсів. Ігри ж виділяються варіативним геймплеєм і навіть NVIDIA Turing не зможе в повній мірі прорахувати всі промені в реальному часі, але перший крок цього напрямку зроблений за допомогою RT-ядер.
Вони допомагають системі визначити, чи перетинає віртуальний промінь світла певний піксель зображення чи ні. А після цього прораховується, наскільки змінюється його освітленість і як це відображається на сусідніх пікселях.
Складність цього завдання є таким, що всі обчислювальні ресурси відеокарти NVIDIA GeForce GTX 1080 Ti забезпечують продуктивність у 1,1 гігапроменів за секунду (Giga Rays/s). А всього 68 RT-ядер відеокарти NVIDIA GeForce RTX 2080 Ti видають більше 10 гігапроменів за секунду. При цьому інші блоки звільняються для виконання інших завдань. До речі, тензорні ядра також беруть участь у технології трасування променів: вони використовуються для придушення супутніх шумів.
На жаль, такої продуктивності недостатньо для повноцінного трасування променів у режимі реального часу, тому в NVIDIA Turing з'явився гібридний метод візуалізації: у деяких ефектах може використовуватися растеризація, а в інших - трасування променів. Але, знову ж таки, її підтримку повинні передбачити самі розробники ігор.
Продуктивність і моделі заливки
Покращення в структурі SM-модулів та архітектурі пам'яті, а також збільшення реєстрового файлу привели до 50%-ого зростання продуктивності шейдерних блоків.
Крім того, NVIDIA пропонує використовувати нові моделі заливки (Shading Model):
- Mesh Shading - пропонує замінити теселяцію, вершинні і геометричні шейдери на більш універсальні Task Shader і Mesh Shader, щоб прискорити обробку складних сцен із великою кількістю об'єктів.
- Variable Rate Shading (VRS) - дозволяє розбити екран на зони розміром 16х16 пікселів, і всередині кожної зони гнучко змінювати щільність вибірки пікселів. Наприклад, якщо конкретна зона не потребує точного визначення кольору пікселів, то їх можна об'єднати в різних варіаціях (1х2, 2х1, 2х2, 4х2, 2х4, 4х4), щоб знизити навантаження на систему. Це доцільно для зафарбовування зображення на периферії. А для центральної частини використовується точнішу модель 1х1.
- Texture-Space Sharing - зберігає результат заливки в пам'яті для подальшого використання, без необхідності повторного прорахунку.
- Multi-View Rendering (MVR) - є подальшим розвитком технології Simultaneous Multi-Projection (SMP). Якщо SMP за один прохід може відмалювати проекцію полігонів на екран із двох точок огляду, то MVR виконує те ж саме для чотирьох точок. Ця технологія буде затребувана, наприклад, у нових поколіннях VR-шоломів.
GDDR6
NVIDIA Turing першої використовує відеопам'ять стандарту GDDR6 з пропускною спроможністю 14 Гбіт/с на контакт. Графічні процесори підтримують по одному 8-гігабітного чіпу на кожен 32-бітний контролер пам'яті. У складі NVIDIA TU104 і TU106 є по 8 контролерів, а NVIDIA TU102 отримав 11. Відповідно, маємо або 8, або 11 ГБ пам'яті. Загальна пропускна здатність зросла до 616 ГБ/с. Для порівняння нагадаємо, що у HBM2 у складі AMD Radeon RX Vega 64 цей показник досягає 484 ГБ/с. Додайте до цього поліпшені алгоритми компресії даних, і ви отримаєте 50%-ий ріст ефективної пропускної здатності в порівнянні з попередниками.
NVLink
Один канал NVLink з 8 лініями має пікову пропускну здатність у 25 ГБ/с в одному напрямку (50 ГБ/с у двох напрямках). Цього достатньо для передачі кадрового буфера з роздільною здатністю 8K. Для двох каналів пропускна здатність підвищується до 50 і 100 ГБ/с відповідно. Цього вистачить для режиму 8K Surround.
Таким чином NVIDIA забезпечила потужний поштовх для подальшого розвитку технології NVIDIA SLI, але реалізувати її можна буде тільки в відеокартах NVIDIA GeForce RTX 2080 і RTX 2080 Ti, і лише в режимі 2-Way для двох адаптерів. Усім бажаючим доведеться додатково витратитися на новий місток NVLink Bridge.
Інтерфейси виводу зображення
Подбала компанія і про підтримку моніторів із надвисокою роздільною здатністю. Для цього в стандартному наборі є порт HDMI 2.0b з максимальною роздільною здатністю 4K @ 60 Гц, три DisplayPort 1.4a (8K @ 60 Гц) і USB Type-C (VirtualLink) для шоломів віртуальної реальності нового покоління.
Стримерам також краще дивитися в бік відеокарт NVIDIA Turing завдяки поліпшеній підтримці кодування HEVC і H.264, а також декодування VP9 і HEVC.
GPU Boost 4.0
І наостанок теоретичного розділу згадаємо про технології GPU Boost 4.0. Нова версія динамічного оверклокінгу пропонує додаткові параметри для тонкого налаштування розгону. У специфікації як і раніше вказується якесь середнє значення швидкості, а не максимальне. Якщо система охолодження і живлення дозволяють, то реальна швидкість динамічного розгону буде вища за ту, яка позначена в специфікації.
Також розроблений інструмент NVIDIA Scanner, підтримка якого вже додана в утиліту EVGA Precision X1. Він дозволяє просканувати вашу відеокарту в автоматичному режимі і визначити максимальні значення тактової частоти і необхідні для цього робочі напруги. Дуже зручно, особливо для новачків-любителів.
ASUS Dual GeForce RTX 2080 OC edition
Тепер давайте перейдемо від теорії до практики на прикладі відеокарти ASUS Dual GeForce RTX 2080 OC edition (DUAL-RTX2080-O8G). Першочергово вона виділяється оновленим 2,7-слотовим кольором і заводським розгоном графічного процесора. Про решту її можливостях розповімо далі.
Специфікація
Модель |
ASUS Dual GeForce RTX 2080 OC edition (DUAL-RTX2080-O8G) |
|
Техпроцес, нм |
12 |
|
GPU |
NVIDIA TU104-400A |
|
Мікроархітектура |
NVIDIA Turing |
|
Кількість CUDA-ядер |
2944 |
|
Кількість текстурних блоків |
184 |
|
Кількість растрових блоків |
64 |
|
Базова / динамічна частота GPU, МГц |
«Gaming» |
1515 / 1800 |
«OC» |
1515 / 1830 |
|
Тип видеопам'яті |
GDDR6 |
|
Об'єм, ГБ |
8 |
|
Ефективна частота пам'яті, МГц |
14 000 |
|
Розрядність шини, біт |
256 |
|
Пропускна спроможність, ГБ/с |
448 |
|
Внутрішній інтерфейс |
PCI Express 3.0 x16 |
|
Зовнішні інтерфейси |
1 x HDMI 2.0b |
|
Додаткові конектори живлення |
1 х 8-контактний |
|
Рекомендована потужність блоку живлення, Вт |
650 |
|
Розміри, мм |
268 х 114 х 58 |
|
Драйвери |
Свіжі драйвери можна завантажити з сайту компанії ASUS або сайту виробника GPU |
|
Сайт виробника |
Упаковка і комплект постачання
Новинка постачається в барвистій картонній упаковці з інформативною поліграфією, яка відображає основні переваги графічного адаптера. На зверхньому боці згадується про безкоштовну 6-місячну преміум-підписку на сервіс WTFast Gamers Private Network. Він автоматично оптимізує шлях проходження ігрових пакетів між комп'ютером користувача і ігровим сервером для мінімізації їх втрати і зменшення середнього часу відгуку (ping).
На нижню сторону виробник помістив рекомендації до блоку живлення: мінімальна його потужність повинна становити 650 Вт, а в наборі конекторів бажано мати один 6-контактний і один 8-контактний PCIe. Ці рекомендації традиційно вказані з запасом, оскільки виробник не може передбачити фінальну конфігурацію користувальницької системи. Реальне енергоспоживання нашого тестового стенда з цією відеокартою вказано на останньому графіку блоку тестування.
У коробці ми виявили тільки інструкцію для користувача і диск з ПЗ.
Зовнішній вигляд
Для відеокарт серії ASUS Dual характерним є поєднання чорно-білої кольоровій схемі, але якщо раніше переважав білий колір, то тепер - чорний. Адаптер виглядає стильно, трохи агресивно і не нудно завдяки безлічі дизайнерських елементів на пластиковому кожусі.
На зворотному боці притулилася металева пластина жорсткості. Вона підтримує масивну конструкцію системи охолодження, запобігаючи вигин або пошкодження друкованої плати, а також бере участь у пасивному відведенні надлишків тепла. Один із кріпильних гвинтів прикритий наклейкою, тому зняти пластину жорсткості без втрати гарантії не вийде.
Розібрати відеокарту ASUS Dual GeForce RTX 2080 OC edition нам не дозволили, тому заглянути всередину і показати вам підсистему живлення з елементною базою ми не можемо. Навіть на офіційному сайті відсутня ця інформація.
У наборі ж зовнішніх інтерфейсів використовується стандартний перелік портів:
- 1 x HDMI 2.0b
- 3 x DisplayPort 1.4a
- 1 x USB Type-C
Максимальна роздільна здатність становить 7680 х 4320.
У верхній частині біля інтерфейсної панелі знаходиться традиційний роз'єм для реалізації технології NVIDIA SLI. Правда, тепер для цього підходять тільки містки NVLink Bridge. У молодших моделях (NVIDIA GeForce RTX 2070 і інших) підтримка цієї технології відсутній.
Для коректної роботи відеокарти ASUS DUAL-RTX2080-O8G необхідно підключити два додаткових конектори живлення PCIe: один 6-контактний і один 8-контактний. Разом зі слотом PCIe 3.0 x16 вони зможуть подати до 300 Вт потужності. Цього вистачить навіть для оверклокерських експериментів.
В основі ASUS DUAL-RTX2080-O8G знаходиться графічний процесор NVIDIA TU104-400A з підтримкою 2944 CUDA-ядер. Тестування проводилося в режимі «Gaming», який використовується за умовчанням. Він характеризуються розгоном динамічної частоти GPU з еталонних 1710 до 1800 МГц. А ось базова швидкість залишилася на референсному рівні.
Підсистема відеопам'яті набрана за допомогою GDDR6-мікросхем компанії Micron загальним обсягом 8 ГБ. Ефективна частота становить 14 ГГц, що при 256-бітної шині дає пропускну здатність в 448 ГБ/с.
На офіційній сторінці вказано про наявність профілю «OC» з розгоном динамічної частоти GPU до 1830 МГц. Але там не згадується режим «Silent», який також є у фірмовій утиліті GPU Tweak II. Він знижує динамічну швидкість до 1770 МГц. Ефективна частота відеопам'яті у всіх випадках залишається незмінною.
Підсвічування в конструкції відеокарти ASUS DUAL-RTX2080-O8G не передбачено.
Система охолодження
Кулер - це одне з ключових змін у дизайні нового представника серії ASUS Dual. Він займає 2,7 слоти розширення, а загальні габарити графічного адаптера становлять 268 х 114 х 58 мм. Тому перед покупкою обов'язково переконайтеся, що в корпусі достатньо місця для новинки.
Конструкція системи охолодження складається з масивного алюмінієвого радіатора без теплових трубок, але з більшою основою. На звороті притулилася пластина жорсткості, яка також бере участь у відведенні тепла. За активний обдув відповідає пара 88-мм осьових вентиляторів з дизайном Wing-blade і захистом від пилу (IP5X).
В автоматичному режимі роботи системи охолодження, при максимальному навантаженні температура графічного процесора досягала 78°С. Вентилятори оберталися на 60% (1989 об/хв) від своєї максимальної швидкості, створюючи дуже тихий фоновий шум, який абсолютно не заважав роботі. Нагадаємо, що критичної для GPU вважається температура в 88°С.
Після примусового встановлення швидкості вентиляторів на 100% (3259-3239 об/хв), температура GPU опустилася до більш приємних 63°С. Шум перевищив середній рівень і перестав бути комфортним для постійного використання.
У режимі простою вентилятори припинили свою роботу завдяки технології 0dB, а температура графічного процесора зменшилася до 48°С. В активний режим пропелери поверталися лише тоді, коли температура GPU піднімалася до 56°С.
Система охолодження відеокарти ASUS Dual GeForce RTX 2080 OC edition навіть в автоматичному режимі втримала температуру графічного процесора в робочих межах, але до критичної позначки залишилося всього 10°С. При максимальній швидкості обертання вентиляторів у неї є хороший запас міцності, але тоді доведеться жертвувати акустичним комфортом. Ніяких сторонніх звуків у вигляді дратівної писку дроселів у процесі тестування помічено не було.
Підписатися на наші канали | |||||
![]() |
![]() |
![]() |
![]() |