Детальне тестування процесора AMD Phenom X4 9750
29-09-2008
Ми вже не раз тестували процесори архітектури K10 AMD Phenom, як X4, так і X3, при цьому не тільки робили стандартні виміри продуктивності і визначення розгінного потенціалу, а і намагалися досліджувати різні режими та особливості їх роботи. Якщо навіть не брати до уваги перші тести і експерименти з не зовсім вдалими Phenom X4 9500 і Phenom X4 9600, але і останні матеріали мають вкраплення практичних і аналітичних вишукувань. Так в оглядах AMD Phenom X3 8650 і AMD Phenom X4 9850 Black Edition ми перевіряли приріст продуктивності від використання пам'яті DDR2-1066, «рідна» підтримка якої є особливістю архітектури K10. Крім того, в останньому огляді були досліджені розходження в режимах Ganged і Unganged роботи вбудованого контролера пам'яті, вплив швидкості обробки команд звертань до пам'яті Command Rate 2T і 1T на швидкодію, а також ми спробували виявити приріст продуктивності від невеликого прискорення шини HyperTransport, що виявилося характерно для досліджуваного тоді процесора. І ось, коли в тестову лабораторію потрапив черговий процесор Phenom X4 з модельним номером 9750, то ми вирішили поглибитися в дослідження архітектурних можливостей AMD K10, а також провести аналіз її масштабованості. Але спочатку, все-таки, стандартна описова частина і звичний набір тестів.
Специфікація
Модель |
AMD Phenom X4 9750 |
Маркування |
HD9750XAJ4BGH |
Процесорний роз’єм |
Socket AM2+ |
Тактова частота, МГц |
2400 |
Множник |
12.0 |
Частота шини HT, МГц |
1800 (3600 MT/s) |
Об'єм кешу L1, КБ |
128 x4 |
Об'єм кешу L2, КБ |
512 x4 |
Об'єм кешу L3, КБ |
2048 |
Ядро |
Agena (B3) |
Кількість ядер |
4 |
Підтримка інструкцій |
MMX, 3DNow!, SSE, SSE2, SSE3, SSE4A, x86-64 |
Напруга живлення, В |
1, 2-1,3 |
Тепловий пакет, Вт |
125 |
Критична температура, °C |
61 |
Техпроцес |
65 нм SOI |
Підтримка технологій |
Cool'n'Quiet 2.0 |
Все цены на AMD Phenom X4 9750
Одразу ж відзначимо, що в модельному ряді процесорів AMD Phenom X4 присутні дві моделі з номером 9750, що відрізняються рівнем TDP. Крім представленої в таблиці специфікацій і, відповідно, процесора HD9750XAJ4BGH, що потрапив на тестування, споживач може зустрітися з енергозаощаджуючою моделлю HD9750WCJ4BGH, що відрізняється енергоспоживанням до 95 Вт при напрузі живлення 1,10-1,25 В.
А процесор, що дістався нам, знову надійшов з OEM-каналу, тобто сам по собі, без упаковки і додаткової комплектації: кулера, сертифіката дійсності, гарантійних зобов'язань на 3 роки, інструкції з встановлення і фірмової наклейки на корпус.
Майже вся специфікація процесорів AMD повторюється в їх маркуванні. На тестуємий процесор Phenom X4 9750 нанесено HD9750XAJ4BGH, що може бути розшифровано приблизно так:
-
процесор AMD архітектури K10 для робочих станцій;
-
рейтинговий номер 9750, тобто це чотирьохядерний Phenom X4 з тактовою частотою 2,4 ГГц для якого використовується ядро з виправленою помилкою в блоці TLB;
-
тепловий пакет процесора до 125 Вт, напруга живлення до 1,3 В, критична температура 61°C;
-
впаковано процесор у корпус 940 pin OµPGA (Socket AM2+);
-
загальний об'єм кеш-пам'яті другого рівня 4 x 512 КБ (2 МБ);
-
використовується ядро Agena степпінгу B3.
Також нагадаємо про функції, які виконують фірмові технології:
-
Cool'n'Quiet 2.0 містить у собі AMD CoolCore Technology і Dual Dynamic Power Management, які дозволяють відключати не використовувані блоки, керувати напругою живлення і тактовою частотою процесора в цілому і процесорних ядрах окремо, а також контролера пам'яті, причому незалежно від ядер процесора, знижуючи енергоспоживання під час простою або низькому навантаженні;
-
Enhanced Virus Protection є програмно-апаратним засобом захисту від переповнення буфера, механізму, який використовують більшість шкідливих програмам - вірусів для завдання збитків або проникнення в систему;
-
Virtualization Technology (AMD-V) дає можливість віртуальним машинам одержувати доступ до апаратних ресурсів, що робить їх більш універсальними, захищеними і продуктивними.
Більш наочно властивості процесора можна подивитися за допомогою утиліти CPU-Z.
Під час тестування використовувався Стенд для тестування Процесорів №1
Материнські плати (AMD) | ASUS M3A32-MVP DELUXE (AMD 790FX, sAM2+, DDR2, ATX)GIGABYTE GA-MA790XT-UD4P (AMD 790X, sAM3, DDR3, ATX) |
Материнські плати (AMD) | ASUS F1A75-V PRO (AMD A75, sFM1, DDR3, ATX)ASUS SABERTOOTH 990FX (AMD 990FX, sAM3+, DDR3, ATX) |
Материнські плати (Intel) | GIGABYTE GA-EP45-UD3P (Intel P45, LGA 775, DDR2, ATX)GIGABYTE GA-EX58-DS4 (Intel X58, LGA 1366, DDR3, ATX) |
Материнські плати (Intel) | ASUS Maximus III Formula (Intel P55, LGA 1156, DDR3, ATX)MSI H57M-ED65 (Intel H57, LGA 1156, DDR3, mATX) |
Материнські плати (Intel) | ASUS P8Z68-V PRO (Intel Z68, sLGA1155, DDR3, ATX)ASUS P9X79 PRO (Intel X79, sLGA2011, DDR3, ATX) |
Кулери | Noctua NH-U12P + LGA1366 KitScythe Kama Angle rev.B (LGA 1156/1366)ZALMAN CNPS12X (LGA 2011) |
RAM | 2х DDR2-1200 1024 МБ Kingston HyperX KHX9600D2K2/2G2/3x DDR3-2000 1024 МБ Kingston HyperX KHX16000D3T1K3/3GX |
Відеокарти | EVGA e-GeForce 8600 GTS 256 МБ GDDR3 PCI-EASUS EN9800GX2/G/2DI/1G GeForce 9800 GX2 1ГБ GDDR3 PCI-E 2.0 |
Жорсткий диск | Seagate Barracuda 7200.12 ST3500418AS, 500 ГБ, SATA-300, NCQ |
Блок живлення | Seasonic SS-650JT, 650 Вт, Active PFC, 80 PLUS, 120 мм вентилятор |
При порівнянні з Intel Core 2 Quad Q6600, що теж працює на частоті 2,4 ГГц, бачимо, що в більшості завдань процесор AMD Phenom X4 9750 виявляється повільніше приблизно на 10%, хоча в деяких тестах і додатках вбудований контролер пам'яті показує перевагу над «зовнішнім», що знаходиться в чіпсеті. Але в цілому, з урахуванням вартості і енергоспоживання, 125-ватної моделі HD9750XAJ4BGH важко на рівні конкурувати з Intel Core 2 Quad Q6600, а ось для 95-ватної моделі HD9750WCJ4BGH підсумок буде визначатися перевагами споживача і набором найбільш часто використовуваних додатків. Відставання ж від більш швидшої моделі AMD Phenom X4 9850 Black Edition знаходиться на рівні приблизно 5%, що для багатьох завдань виявиться не помітно «на око».
Визначившись із продуктивністю, тепер перейдемо до більш глибшого дослідження різних аспектів швидкодії системи на базі процесора AMD Phenom X4 9750 і особливостей роботи самого процесора.
Вплив швидкості пам'яті на продуктивність
У попередніх матеріалах ми перевіряли тільки потенціал переходу з DDR2-800 на DDR2-1066, а тепер давайте подивимося як буде змінюватися продуктивність системи при встановленні ще більш повільної пам'яті. З одного боку, можливо, у когось ще є DDR2-533 або DDR2-667, наприклад внаслідок апгрейду системи, а з іншого боку це дозволить оцінити ефективність роботи не тільки контролера пам'яті, але і кеш-пам'яті третього рівня.
Для експерименту ми не шукали різні застарілі модулі пам'яті, а скористалися одним набором 2x 1 ГБ Transcend aXeRam DDR 2-1066+ (TX1066QLJ-2GK), поступово сповільнюючи його і виставляючи таймінги по SPD.
Найбільш критичним виявився перехід з, в принципі, вже не існуючої DDR2-400 на настільки ж морально застарілій DDR2-533, подальше прискорення пам'яті вже не так помітно вплинуло на загальну продуктивність. Але, з огляду на ще деяку актуальність модулів DDR2-667, ми обчислили приріст продуктивності при переході з її на DDR2-1066 (ефективність DDR2-800 знаходиться десь між цими значеннями).
Тестовий пакет |
Результат |
Приріст продуктивності, % | ||
DDR 2-667 |
DDR 2-1066 | |||
Futuremark PCMark'05 |
CPU |
7084 |
7100 |
0,23 |
Memory |
4235 |
4409 |
4,11 | |
Graphics |
8421 |
8553 |
1,57 | |
CrystalMark |
ALU |
38030 |
37954 |
-0,20 |
FPU |
39192 |
39457 |
0,68 | |
Memory |
21202 |
25967 |
22,47 | |
Futuremark 3DMark'06 |
Mark Score |
6118 |
6123 |
0,08 |
CPU Score |
3336 |
3354 |
0,54 | |
SmartFPS.com v1.5, Max Quality, 800x600, fps |
Battlefield 2 |
134,0 |
142,7 |
6,49 |
Serious Sam 2 |
111,2 |
114,3 |
2,79 | |
Quake 4 |
120,0 |
125,1 |
4,25 | |
Prey |
146,9 |
151,0 |
2,79 |
Найбільш чутливим до швидкості пам'яті виявився синтетичний тест CrystalMark, а в інших «реальних» завданнях найбільший приріст швидкодії виявився всього 6,5%. З огляду на ці результати, можна зробити висновок про дуже ефективну роботу вбудованого контролера пам'яті і великій користі від використання 2 Мб кеш-пам'яті L3. Таким чином, хоча прискорення пам'яті і приносить деяке підвищення швидкодії, але якщо це вимагає додаткових витрат часу і грошей, то може бути не завжди виправдано.
Якщо нема чим заповнити другий канал пам'яті
Цілком можлива ситуація, що з якихось причин тимчасово або на досить тривалий період у наявності виявиться тільки один модуль оперативної пам'яті і двоканальний режим контролера пам'яті виявиться недоступним. На скільки впаде продуктивність?
Зацікавившись цим питанням, ми змінили конфігурацію системи таким чином, що загальний об'єм системної пам'яті залишився попереднім, але тепер вона почала працювати в одноканальному режимі.
Тестовий пакет |
DDR2-800 |
Падіння продуктивності, % | ||
Dual Channel |
Single Channel | |||
Futuremark PCMark'05 |
CPU |
7106 |
7085 |
-0,30 |
Memory |
4305 |
4243 |
-1,44 | |
Graphics |
8438 |
8422 |
-0,19 | |
CrystalMark |
ALU |
38003 |
37974 |
-0,08 |
FPU |
39188 |
39080 |
-0,28 | |
Memory |
23469 |
18564 |
-20,90 | |
Futuremark 3DMark'06 |
Mark Score |
6126 |
6120 |
-0,10 |
CPU Score |
3371 |
3359 |
-0,36 | |
SmartFPS.com v1.5, Max Quality, 800x600, fps |
Battlefield 2 |
136,3 |
134,4 |
-1,39 |
Serious Sam 2 |
113,1 |
112,1 |
-0,88 | |
Quake 4 |
121,5 |
118,3 |
-2,63 | |
Prey |
148,5 |
144,7 |
-2,56 |
Результат виявився цікавим, тільки повністю синтетичний тест дійсно помітив зміни в роботі оперативної пам'яті, а інші додатки втратили у швидкодії зовсім небагато, у більшості випадків на рівні погрішності виміру. Цей результат ще раз підтверджує ефективність контролера пам'яті, кеш-пам'яті L3 і взагалі архітектури AMD K10.
Швидкість роботи вбудованого північного мосту
Оскільки ми декілька разів переконалися в ефективності всіх компонентів процесора, які є основною частиною вбудованого в процесор північного мосту, то ми зацікавилися залежністю продуктивності системи від тактової частоти, на якій він працює. Крім того, у більшості материнських плат цей параметр задається окремим множником, який можна змінювати. Практична частина цього дослідження виявиться цікава любителям розгону, бо для успішного оверклокінгу процесорів AMD Phenom швидкість вбудованого північного мосту (NB) потрібно спочатку занижувати, а потім на прискореному процесорі не завжди вдається повернути їй вихідне номінальне значення без підвищення напруги і збільшення тепловиділення. Чи веде це до якогось зменшення швидкодії?
У більшості випадків 800 МГц є мінімальним можливим значенням, тому ми провели ряд тестів у діапазоні 800-1800 МГц з кроком 1x, що відповідає 200 МГц.
Звичайно, найбільш чутливими до швидкості роботи виявилися додатки і режими, що вимагають швидкого обміну з оперативною пам'яттю, але навіть для них тільки суттєве сповільнення NB приводить до відчутного зменшення продуктивності.
Тестовий пакет |
NB Frequency |
Падіння продуктивності, % | ||
1800 MHz |
800 MHz | |||
Futuremark PCMark'05 |
CPU |
7106 |
6988 |
-1,66 |
Memory |
4305 |
3304 |
-23,25 | |
Graphics |
8438 |
7882 |
-6,59 | |
CrystalMark |
ALU |
38003 |
37502 |
-1,32 |
FPU |
39188 |
38819 |
-0,94 | |
Memory |
23469 |
15284 |
-34,88 | |
Futuremark 3DMark'06 |
Mark Score |
6126 |
6028 |
-1,60 |
CPU Score |
3371 |
3018 |
-10,47 | |
SmartFPS.com v1.5, Max Quality, 800x600, fps |
Battlefield 2 |
136,3 |
105,5 |
-22,60 |
Serious Sam 2 |
113,1 |
93,4 |
-17,42 | |
Quake 4 |
121,5 |
98,5 |
-18,93 | |
Prey |
148,5 |
128,3 |
-13,60 |
Овеклокерам же не варто побоюватися, якщо частота вбудованого північного мосту виявиться трохи нижче номіналу, з іншого боку, і його невеликий розгін не зробить помітного впливу на швидкодію.
Крім того, у наведених результатах є погрішність, що ще сильніше зменшує вплив швидкості вбудованого північного мосту на загальну швидкодію...
Вплив швидкості роботи HyperTransport
Справа в тому, що частиною процесорного північного мосту є і контролер шини HyperTransport, що відповідає за швидкість обміну даними із системою. Відповідно і при сповільненні NB відбувається сповільнення шини HyperTransport і, ті ж дані тривимірної сцени, від процесора до відеокарти надходять повільніше. Тому ми окремо вирішили перевірити вплив на швидкодію пропускної здатності каналу між процесором і системою. До речі і ця шина в процесі розгону може почати працювати трохи повільніше номіналу або бути прискорена, хоча в останньому випадку нерідко потрібне збільшення напруги сигнального рівня.
Добре, що практично будь-яка материнська плата дозволяє керувати швидкістю HyperTransport у дуже широкому діапазоні і незалежно від швидкості роботи вбудованого північного мосту, що обмежує тільки максимум. Тому з тестуємим процесором мінімальним значенням виявилася частота 200 МГц або 1x, що відповідає швидкості HyperTransport 400 MT/s, бо шина двоспрямована.
Цікаво, що нам не вдалося помітити великого впливу швидкості HyperTransport на швидкодію системи.
Тестовий пакет |
HT Frequency |
Падіння продуктивності, % | ||
1800 MHz |
200 MHz | |||
Futuremark PCMark'05 |
CPU |
7106 |
7063 |
-0,61 |
Memory |
4305 |
4260 |
-1,05 | |
Graphics |
8438 |
7892 |
-6,47 | |
CrystalMark |
ALU |
38003 |
37915 |
-0,23 |
FPU |
39188 |
39084 |
-0,27 | |
Memory |
23469 |
23450 |
-0,08 | |
Futuremark 3DMark'06 |
Mark Score |
6126 |
5527 |
-9,78 |
CPU Score |
3371 |
3353 |
-0,53 | |
SmartFPS.com v1.5, Max Quality, 800x600, fps |
Battlefield 2 |
136,3 |
134,1 |
-1,61 |
Serious Sam 2 |
113,1 |
102,1 |
-9,73 | |
Quake 4 |
121,5 |
116,2 |
-4,36 | |
Prey |
148,5 |
144,4 |
-2,76 |
Навіть ігрові додатки не особливо відреагували на значне сповільнення каналу HyperTransport, хоча в цілому саме графічні додатки показали хоч якусь важливість швидкості роботи цієї шини. Можливо, ми використовували не зовсім вірний набір тестових пактів, бо результат виявився досить несподіваним.
Масштабованість архітектури AMD K10
Під масштабованістю архітектури ми маємо на увазі вплив кількості активних процесорних ядер на обчислювальну потужність системи. Адже теоретично додавання кожного нового ядра повинно пропорційно збільшувати швидкодію, наприклад, 2 ядра в 2 рази швидше одного, а 3 ядра - у три і т.ін.. Але на практиці цього не відбувається, тому що з одного боку з'являється ефект конкуренції ядер за ресурси, починається розподіл між ними пропускних здатностей зовнішніх і внутрішніх шин, а також пам'яті і кеш-пам'яті. З іншого боку і програмне забезпечення, починаючи від самої операційної системи, повинне вміти працювати в багатопоточному режимі. Будемо вважати, що другий пункт умовно дотримується, і проведемо тести.
Як бачимо, в умовах гарного розпаралелювання виконуваного завдання і малих її вимог до системних ресурсів архітектура AMD K10 забезпечує відмінну масштабованість. У тестовому пакеті CrystalMark виконання математичних операцій прискорюється прямо пропорційно кількості активних ядер. Приблизно таку ж лінійну залежність демонструють і деякі інші більш ресурсномісткі завдання (наприклад, CPU Test в 3DMark'06), але там вже помітний вплив конкуренції за доступ ядер до системних ресурсів. А ось для мало оптимізованих під багатопоточність додатків, найкращою ілюстрацією яких є не самі нові ігри, у черговий раз підтверджується відсутність помітної користі від трьох- і чотирьохядерних процесорів. Останнє, в першу чергу, говорить про те, що купуючи вже сьогодні комп'ютер із сучасним чотирьохядерним процесором, таким як AMD Phenom X4 9750, потрібно уявляти можливості додатків, які будуть на ньому працювати, щоб не розчаруватися у відсутності видимої користі від придбання досить дорогої системи.
Розгін AMD Phenom X4 9750
І, нарешті, приступимо до розгону тестуємого процесора, використовуючи раніше розроблену методику.
При напрузі живлення 1,44 В процесор вдалася змусити стабільно працювати тільки на частоті 2830 МГц, що не так вже і багато. Подальше збільшення напруги тільки знижувало стабільність внаслідок різкого збільшення тепловиділення. Не допомогла навіть заміна стандартного для стенда AMD кулера akasa AK-859 на Thermalright SI-128 + VIZO Starlet UVLED120. Найімовірніше, у настільки незначному розгоні винний початково дуже великий рівень TDP процесора, а може нам просто попався не зовсім придатний для розгону екземпляр. При цьому оперативна пам'ять змогла працювати на майже номінальній частоті, що дозволить повторити такий розгін навіть при використанні недорогих модулів.
У підсумку, розгін склав всього 18%, з 2,4 ГГц до 2,83 ГГц, давайте подивимося, як це позначиться на продуктивності системи.
Тестовий пакет |
Результат |
Приріст продуктивності, % | ||
Номінальна частота |
Розігнаний процесор | |||
Futuremark PCMark'05 |
CPU |
7106 |
8324 |
17,14 |
Memory |
4305 |
4670 |
8,48 | |
Graphics |
8438 |
8742 |
3,60 | |
CrystalMark |
ALU |
38003 |
44472 |
17,02 |
FPU |
39188 |
47164 |
20,35 | |
Memory |
23469 |
24106 |
2,71 | |
WinRar, Kb/s |
1622 |
1751 |
7,95 | |
Futuremark 3DMark'05 |
Mark Score |
11795 |
11994 |
1,69 |
CPU Score |
15992 |
16839 |
5,30 | |
Futuremark 3DMark'06 |
Mark Score |
6126 |
6220 |
1,53 |
CPU Score |
3371 |
3857 |
14,42 | |
SmartFPS.com v1.5, Max Quality, 800x600, fps |
Battlefield 2 |
136,3 |
147,9 |
8,51 |
Serious Sam 2 |
113,1 |
123,8 |
9,46 | |
Quake 4 |
121,5 |
130,4 |
7,33 | |
Prey |
148,5 |
157,3 |
5,93 |
Звичайно, приємно отримати до 20% «безкоштовної» продуктивності, але може виявитися, що збільшення тепловиділення і, як наслідок, гучності системи охолодження, того не варті, особливо якщо більшу частину часу ви займаєтеся серфінгом у мережі і переглядом фільмів. Але якщо продуктивність важлива, то перед розгоном старших AMD Phenom варто подбати про суттєве поліпшення їх охолодження, бажано без зайвого шуму.
Підсумок
Процесор AMD Phenom X4 9750, особливо його версію з тепловим пакетом до 95 Вт, можна сміло розглядати як цікаву альтернативу «хітовому чотирьохядернику» Intel Core 2 Quad Q6600, особливо якщо ви негативно ставитеся до розгону. При цьому ви зможете навіть трохи заощадити на всій системі в зборі, не помітивши особливої різниці продуктивності в більшості завдань, а в чомусь, можливо, навіть отримаєте перевагу. Але, збираючи комп'ютер з чотирьохядерним процесором, варто уявляти завдання, для яких він буде використовуватися. Адже цілком імовірна ситуація, що ви не зможете ефективно використовувати весь його архітектурний потенціал, і тоді значно більше користі буде від «звичайного» двоядерного процесора з більшою тактовою частотою або, навіть, більшого обсягу оперативної пам'яті або більш швидшого графічного адаптера.
Автор: Олександр Черноіван
Переклад: Анна Смірнова
Висловлюємо подяку фірмі ТОВ ВФ Сервіс (м. Дніпропетровськ) за надане для тестування обладнання.
-->Підписатися на наші канали | |||||