Огляд відеокарти GIGABYTE Radeon HD 5870 на новому GPU ATI RV870
11-11-2009
Здається, що зовсім недавно була представлена нова версія API DirectX 10 і разом з нею представлені революційні графічні адаптери з новою архітектурою. Але розвиток технологій ніколи не зупиняється і після декількох років світ побачив DirectX 11. А разом з новою API розробники графічних процесорів представляють абсолютно нові відеокарти з повною підтримкою нових технологій, що присутні в до складу Microsoft DirectX 11. Першими, хто запропонував свої нові графічні процесори з повною підтримкою DirectX11, стала компанія AMD, яка випустила відеокарту Radeon HD 5870, побудовану на чіпі ATI RV870. Давайте розглянемо, які ж зміни AMD додала до нового покоління графічних процесорів RV870 і наскільки вони відрізняються від своїх попередників Radeon HD 4870, які побудовані на чіпі ATI RV770.
Чіп AMD ATI RV870 (Radeon HD 5870)
Починаючи з найнижчого рівня SPU, додано декілька нових апаратних інструкцій, і зросла швидкість реалізації попередніх. Це було зроблено як для збільшення продуктивності, так і для відповідності чіпа стандартам різних API останніх версій. Прискорення роботи досягнуте завдяки тому, що окремі інструкції, яким необхідна була для виконання деяка кількість циклів, тепер можуть бути розраховані за один крок. Підтримка потрібних для DirectX 11 команд, таких як count, insert і extract, була додана якраз на цьому рівні. Окрема увага була приділена розрахунку піднормалей, які зараз розраховуються без втрати продуктивності.
Виконання інструкцій за один такт
Напевно, однією з найцікавіших доданих інструкцій стала сума модулів різниці – Sum of Absolute Differences (SAD). Вона особливо часто використовується при кодуванні відео і аналізі графічних даних, оскільки в геометричному плані з її підтримкою легко оцінювати рух. У випадку з RV770 апаратна підтримка SAD була відсутня, а для її емуляції була необхідна послідовність приблизно з 12 інструкцій. З додаванням SAD в SPU виконання інструкції займає один єдиний такт, і, за словами AMD, це повинно більш ніж вдвічі прискорити кодування відео силами GPU. Дещо розчаровує те, що SAD не є незмінною частиною DirectX 11 чи OpenCL, отже, написані під DirectX програми не можуть викликати її. То ж справедливо і для OpenCL, але для цього API хочаб є необхідна бібліотека. Втім, API не обмежують жорстко поведінку GPU, тому динамічний компілятор AMD може на льоту розпізнати можливості оптимізації (наприклад – згадана вище послідовність з 12 інструкцій) і підмінити потрібні частини загального коду на більш діючі для даної конкретної архітектури. Тобто, навіть якщо програміст і не викликав будь-які необхідні функції вручну, інтелектуальні алгоритми зможуть здійснювати це упущення самостійно.
Список інструкцій, які блок RV870 може здійснювати за один такт:
- 4x 32-бітових FP MAD
- 2x 64-бітових FP MUL або ADD
- 1x 64-бітовий FP MAD
- 4x 24-бітових Int MUL або ADD
- SFU: 1x 32-бітовий FP MAD
Переходимо до SIMD-блоків. Окрім вдосконалень в SP, текстурний кеш L1, розміщений тут, отримав значний додаток до продуктивності. Хоча його розмір не видозмінився (в кожного SIMD в наявності по 16 КБ L1), швидкість роботи з даними збільшилася до вражаючих 1 ТБ/с. Крім цього, на додаток до наявного текстурного кешу, було додано 8 КБ для збереження проміжних підрахунків SIMD. Нарешті, вдвічі зросло (до 32 КБ) локальне сховище даних, підключене до кожного модуля.
Будова SIMD блоків практично ідентична
Також були перероблені модулі текстур. Перше з внесених видозмін – додана можливість читання стислих AA буферів кольору для більш розумного вживання пропускної спроможності. Друге – в AMD мали на меті підняти швидкість інтерполяції, і здійснили це досить цікавим чином. Текстурні модулі взагалі позбавили цієї здатності, винесли її в обов'язку SP (частина специфікацій DirectX 11). Це дозволило значно збільшити швидкість виконання операцій даного типу. В наслідок чого текстурні модулі RV870 мають вищу швидкість зафарбовування (філрейта), ніж в RV770. AMD стверджує, що чіп здатний в сукупності досягати показника в 68 мільярдів білінійний відфільтрованих текселей в секунду, що є наслідком перекидання інтерполяції на SP і виконаної оптимізації для ефективного використання пропускної спроможності. Знову роблячи крок вгору по сходах архітектурних рівнів, добираємося до основної причини переваги в продуктивності RV870 над своїм попередником. AMD подвоїла число блоків SIMD з 10 до 20 штук. Тобто двократну кількісну перевагу по всьому, починаючи від SP і кінчаючи модулями текстур. Це досить банальна зміна, на відміну від додавання нових низькорівневих команд або переробки кешів, але як ми бачимо, найбільш результативна.
Будова ядра RV870
Безпосередньо заради максимально ефективного завантаження роботою такої кількість потокових процесорів, були внесені зміни в алгоритми розподіляючого диспетчера Ultra-Threaded Processor, об'єм 4-х блоків кеш-пам'яті L2 був подвоєний з 64 до 128 КБ, причому одночасно вони набули прискорення в роботі. Раніше вони були об'єднані з надшвидкою пам'яттю першого рівня на швидкості до 384 ГБ/с, тепер – 435 ГБ/с. Врешті-решт, загальний буфер даних був збільшений в 4 рази, до 64 КБ. Ми бачимо, що AMD не лише подвоїла всі виконавчі блоки і розширила їх функціональність, але і потурбувалася про відсутність вірогідних вузьких місць.
Такий вигляд мав загальний буфер в RV770
А так загальний буфер виглядає в RV870
Для того, щоб обробити все те, що розраховують SIMD-процесори, подвоїли і блоки ROP. Це означає, що їх кількість в RV870 збільшилася до 32 штук. Самі ROP також мали косметичу переробку, внаслідок чого їх продуктивність також трохи зросла. Тепер блоки растеризування можуть проводити швидке очищення кольору, адже згідно дослідженням AMD, багато ігор проводять сотні таких операцій між кадрами. Також ROP відповідальні і за окремі стадії нового методу згладжування SSAA, представленого ATI разом з 5000-ою лінійкою своїх відеокарт.
Останнє вдосконалення – AMD Graphics Engine
AMD Graphics Engine
Блок апаратної тесселяції внесли ще в RV770, проте, незважаючи на свої широкі можливості, розробники ігор практично не застосовували його, обходячи стороною. У DirectX 11 з'явилася потреба в неминучій наявності такого блоку в GPU, і наявний в RV770 був покращений для відповідності специфікаціям DX11. До речі, якщо в RV770 такий модуль був один, для найкращого балансу і рівномірності завантаження масиву з 20 SIMD, в RV870 додали другий.
Так виглядає еталонна відеокарта Radeon HD 5870
Як ми бачимо, архітектура AMD ATI RV870 набула безліч змін в порівнянні з RV770, проте деякі елементи залишилися не змінені. Інженери з AMD не стали шукати щось зовсім нове, вони добре модернізували відеочіп минулого покоління.
|
Radeon HD 4870 |
Radeon HD 4890 |
Radeon HD 5870 |
Кодове ім'я |
RV770 |
RV790 |
RV870 |
Площа чіпу, кв. мм. |
263 |
263 |
334 |
Техпроцес, нм |
55 |
55 |
40 |
К-ть транзисторів, млрд. шт. |
0,956 |
0,959 |
2,15 |
Частота ядра, МГц |
750 |
850 |
850 |
Частота пам'яті (ефективна QDR), МГц |
900 |
975 |
1200 |
Блоків текстур, шт. |
40 |
40 |
80 |
Шейдерних процесорів, шт. |
800 |
800 |
1600 |
Блоків ROPs, шт. |
16 |
16 |
32 |
Об'єм пам'яті, МБ |
512/1024 |
1024 |
1024 |
Підтримувані API |
DirectX 10.1 |
DirectX 10.1 |
DirectX |
Підтримка Eyefinity |
Немає |
Немає |
Є |
Але наскільки відеокарти на Radeon HD 5870 стали потужніше своїх попередників в особі прискорювачів на Radeon HD 4870 і Radeon HD 4890, зможуть нам відповісти лише результати тестування в іграх і синтетичних тестах. Тому цей огляд буде присвячений одному з перших рішень на AMD ATI Radeon HD 5870, яке попало в нашу тестову лабораторію - GIGABYTE Radeon HD 5870 (GV-R587D5-1GD-B).
Специфікація:
Модель
|
GIGABYTE Radeon HD 5870 |
Графічне ядро |
(AMD) ATI Radeon HD 5870 (RV870 PRO) |
Конвеєра |
1600 уніфікованих потокових |
Підтримувані API |
DirectX 11 (Shader Model 5.0) |
Частота ядра, МГц |
850 |
Об'єм (тип) пам'яті, МБ |
1024 (GDDR5) |
Частота пам'яті (ефективна), МГц |
1200 (4800) |
Шина пам'яті, біт |
256 |
Стандарт шини |
PCI Express X16 2.0 |
Максимальна роздільна здатність |
До 2560x1600 (Dual-link DVI) або 1920x1200 (Single-link DVI) |
Виходи |
2x DVI-I (HDMI/VGA через перехідники) |
Підтримка HDCP |
Так |
Драйвери |
Свіжі драйвери можна викачати з: |
Сайт виробника |
Не важко побачити, що характеристики відеокарти дуже схожі з рекомендованими виробником GPU, тому в плані продуктивності прискорювач описує можливості будь-якого «референсного» рішення на Radeon HD 5870.
Відеокарта поставляється в досить габаритній картонній упаковці. Зовнішній вигляд і оформлення коробки нагадує таку саму, яку мають останні рішення компанії з пасивними системами охолодження. Основний акцент зроблений на графічному процесорі ATI Radeon HD 5870, який є в основі прискорювача, а також на наявності виходу DisplayPort.
На зворотному боці упаковки описуються особливості графічного прискорювача і акцентується увага на підтримці Microsoft DirectX 11 і технології ATI Eyefinity, яка через DisplayPort дозволяє використовувати для візуалізації ігри декілька моніторів.
Комплект постачання версії GIGABYTE Radeon HD 5870 у роздрібний продаж досить складно оцінити, оскільки в коробці разом з тестовим семплом ми виявили лише:
- Два перехідники з периферійного роз'єму живлення на 6-контактний роз'єм живлення відеокарти;
- Перехідник з DVI на D-Sub;
- Місток CrossFire.
В комплекті відсутній диск з драйверами і утилітами, а також коротка інструкція з встановлення відеокарти, але, напевно, з купленим в крамниці прискорювачем ці компоненти будуть.
Зовнішньо відеокарта GIGABYTE Radeon HD 5870 дуже схожа на еталонний прискорювач, копією якого, скоріше над усе, вона і є. Але, все ж, зовнішній вигляд системи охолодження і фірмові написи відрізняють відеокарту.
Згідно габаритам нова відеокарта виявилася чималою, наприклад, вона приблизно на сантиметр довше за двочіповий прискорювач від NVIDIA. Такі габарити можуть створити деякі проблеми при встановленні нових прискорювачів в деякі корпуси.
На звороті прискорювач майже повністю прихований під металевою пластиною, яка в основному збільшує жорсткість конструкції і забезпечує надійніше кріплення системи охолоджування.
У правій частині верхнього торця прискорювача знаходяться два 6-контактні роз'єми додаткового живлення, що говорить про не найвищий рівень енергоспоживання. Останнє дозволяє сподіватися на те, що стандартної турбіни буде достатньо для охолодження без необхідності розкручувати турбіну до дуже високої швидкості, що створюватиме багато шуму. До речі, цікаво виглядають два «сопла» в торці кожуха кулера, які по ідеї повинні поліпшити циркуляцію повітря.
Зліва зверху відеокарти знаходяться два роз'єми для містків CrossFire, що добре на майбутнє і є підмогою для тих, хто бажає отримати безкомпромісно швидку ігрову станцію.
Завдяки двослотовому дизайну системи охолодження на прискорювачі реалізовано багато відеовиходів: два універсальні виходи DVI, мультимедійні виходи HDMI і DisplayPort. Для підключення аналогового монітора необхідно буде скористатися перехідником з комплекту постачання.
Лицьова сторона друкованої плати досить насичена різними елементами: окрім самого GPU тут розташувалися всі чіпи відеопам'яті і всі основні вузли стабілізатора живлення.
На звороті плати є лише деяка частина дрібних елементів.
Відеопам'ять загальним об'ємом 1 ГБ набрана вісьма мікросхемами стандарту GDDR5 виробництва SAMSUNG (K4G10325FE-HC04) з часом відгуку 0,4 нс, що дозволяє їм працювати на ефективній частоті до 5000 МГц. Оскільки результуюча частота роботи чіпів пам'яті на відеокарті трохи нижче і складає 4800 МГц, то залишається вузенький резервний частотний коридор.
Частота роботи графічного процесора відповідає рекомендованому значенню 850 МГц. Як вже описувалося раніше, сам чіп RV870 виконаний по 40 нм техпроцесу, що обумовлює його відносно невелике енергоспоживання, не дивлячись на те, що в нього входять 2154 млн. транзисторів. Кількість уніфікованих шейдерних процесорів збільшене до 1600, блоків текстур до 80, а кількість ROP дорівнює 32.
За відсутності навантаження частота роботи чіпа знижується до 157 МГц, а відеопам'ять сповільнюється до 300 МГц (ефективна частота 1200 МГц). При цьому зменшується і напруга живлення, що забезпечує помітне зниження енергоспоживання і температури.
Тепер розглянемо систему охолодження відеокарти. Основна турбіна складається з металевої основи, яка є радіатором для чіпів пам'яті і компонентів стабілізатора живлення, прилягаючи до них через термопрокладки, а також радіаторного блоку з мідного теплопередавача, чотирьох теплових трубок і алюмінієвих ребер.
Для збільшення ефективності контакт між тепловими трубками і алюмінієвими пластинами якісно припаяний. Охолоджує всю цю конструкцію, приховану під пластиковим кожухом, досить звична на вигляд турбіна.
Для оцінки ефективності системи охолодження ми використали утиліту FurMark, а детальний моніторинг здійснювався за допомогою GPU-Z. Працюючи на штатних частотах і керуючи швидкістю обертання турбіни автоматично, графічний процесор прогрівся до 85°С, хоча один з додаткових термодатчиків засвідчив температуру на 6,5 градусів вище. Враховуючи те, що при цьому швидкість обертання турбіни була лише 37% від максимальної і кулер залишався дуже тихим, ми можемо казати про не дуже велике тепловиділення прискорювача і відмінну роботу системи охолодження.
Підписатися на наші канали | |||||