Знайомство з ядром Lynnfield на прикладі процесора Intel Core i7-860
12-09-2009
Як ми вже розповідали, 8 вересня 2009 р. корпорація Intel представила нові процесори для високопродуктивних масових настільних ПК та «односокетних» серверних комп'ютерів. В цих чіпах реалізована обновлена інноваційна мікроархітектура Nehalem, яка відтепер доступна не тільки геймерам і ентузіаст, але і масовому користувачу у вигляді ядр Lynnfield. Процесори Intel Core i7, Intel Core i5, Intel Xeon 3400 для масового сегменту забезпечують високу продуктивність і ще більш ефективне керування споживанням енергії. Корпорація Intel виготовляє нові процесори відповідно 45-нанометровому техпроцесу.
У цих чіпах реалізована вдосконалена революційна технологія Intel Turbo Boost, а найбільш передові моделі серії Intel Core i7 підтримують також Intel Hyper-Threading Technology. Завдяки цим технологіям нові процесори стають більш «високоінтелектуальними» і можуть самостійно оптимізувати енергоспоживання та продуктивність системи.
Архітектурною особливістю ядра Lynnfield є інтегрований контролер PCI Express 2.0 на 16 ліній, який повинен служити для зв'язку з одним або двома дискретними відеоприскорювачами. Причому два відеоприскорювачі можуть поєднуватися в одну систему завдяки технологіям SLI чи CrossFireХ, якщо їх підтримка буде реалізована в материнській платі. Іншою особливістю ядра Lynnfield є наявність інтегрованого 64-розрядного (двоканального) контролера пам'яті DDR3. По специфікації контролер гарантовано підтримує пам'ять DDR3-800/1066/1333, а з більш швидкими модулями, підтримку яких заявляють більшість виробників материнських плат для нових процесорів, контролер працює тільки при розгоні. Встановлюються процесори Intel Core i7, Intel Core i5 й Intel Xeon 3400 у новий процесорний роз’єм LGA 1156.
Для підтримки процесорів була розроблена нова системна логіка Intel P55 Express, що стала більш компактною, тому що замість двох чіпів, північного та південного мостів, тепер використовується тільки одна мікросхема. Тепер чіпсет відповідає в основному за операції, пов'язані з керуванням введення та виводу, тобто, по суті, йому залишилися функції південного мосту. Процесор і чіпсет Intel P55 Express зв'язані новим апаратним мостом Direct Media Interface (DMI). Нещодавно ми робили огляд системної плати GIGABYTE GA-P55M-UD2 на наборі логіки Intel P55 Express, де розглядали його характеристики. В цьому ж огляді поговоримо про саме ядро Lynnfield і нові технології, що стало можливим завдяки одержанню інженерного семпла процесора Intel Core i7-860.
Самою помітною технологією в нових процесорах стала оновлена версія Intel Turbo Boost, що керує продуктивністю процесора залежно від вимог додатка.
Нова схема керування ядрами дозволяє робити відключення до трьох процесорних ядер, паралельно збільшуючи процесорний множник, що робить інші ядра більш швидкими та забезпечує прискорення виконання неоптимізованих під багатопоточність додатків. Так, під час виконання однопоточних завдань процесори Core i7-860 і Core i7-870 здатні збільшити множник на п'ять, відключаючи три невикористовуваних ядра, що відповідно збільшує частоту одного активного на 665 МГц. У двопоточних додатках продуктивність також збільшується досить відчутно - на чотири кроки множника. При цьому і під час активного використання трьох і чотирьох ядер процесор може трошки прискорюватися - на один крок. Однак, одним з важливих моментів роботи технології, на чому акцентує увагу Intel, є те, що не залежно від режиму роботи та завантаження процесора його TDP (тепловий пакет, енергоспоживання) не виходить за межі номінального значення.
Конфігурації збільшення множників для різних процесорів дивіться в таблиці:
Збільшення множника технологією Turbo Boost | |||||
Модель процесора |
Частота |
4 активні ядра |
3 активні ядра |
2 активні ядра |
1 активні ядра |
Core i7-870 |
2,93 ГГц |
2 |
2 |
4 |
5 |
Core i7-860 |
2,8 ГГц |
1 |
1 |
4 |
5 |
Core i7-750 |
2,66 |
1 |
1 |
4 |
4 |
Core i7-975 |
3,33 |
1 |
1 |
1 |
2 |
Core i7-950 |
3,06 |
1 |
1 |
1 |
2 |
Core i7-920 |
2,66 |
1 |
1 |
2 |
2 |
Засновані на мікроархітектурі Nehalem, процесори Lynnfield підтримують технологію Hyper-Threading (Simultaneous Multi-Threading), що емулює декілька логічних ядер на одному фізичному для більш повного завантаження обчислювальних блоків. Дана технологія буде корисна в програмах, де добре реалізоване паралельне виконання декількох обчислень.
Перейдемо до специфікації Intel Core i7-860:
Модель |
Intel Core i7-860 |
Маркування (роздрібної версії) |
SLBJJ |
Процесорний роз’єм |
LGA1156 |
Тактова частота, ГГц |
2,8 |
Множник |
21 |
Частота шини, МГц |
133 |
Об'єм кеш-пам'яті L1 (Дані\Інструкції), КБ |
4x32\4x32 |
Об'єм кеш-пам'яті L2, КБ |
4x256 |
Об'єм кеш-пам'яті L3, КБ |
8192 |
Ядро |
Lynnfield |
Кількість ядер |
4 |
Підтримка інструкцій |
MMX, SSE, SSE2, SSE3, SSSE3, SSE4.1, SSE4.2, EM64T |
DMI |
2,5 ГT/c |
Напруга живлення, В |
0,65-1,4 |
Потужність, що розсіюєьтся, Вт |
95 |
Критична температура, °C |
- |
Техпроцес |
45 нм |
Підтримка технологій |
Enhanced Halt State (C1E) |
Специфікація контролера пам'яті | |
Максимальний об'єм пам'яті, ГБ |
16 |
Типи пам'яті |
DDR3-800/1066/1333 |
Число каналів пам'яті |
2 |
Максимальна пропускна здатність, ГБ/c |
21 |
Підтримка ECC |
немає |
За розміром процесори LGA1156 помітно поступаються рішенням для LGA1366 і фактично мають розміри як у вже звичних моделей для LGA775.
У зв’язку зі зменшенням ширини контролера пам'яті до двох каналів, процесори Lynnfield мають 1156 контактних площадок, які все ще не покривають всю нижню поверхню та забезпечують присутність «начіпних» елементів.
На теплорозподільній кришці роздрібного процесора Intel Core i7-860 буде вказуватися технічна інформація, але, оскільки екземпляр, який потрапив на перше тестування, процесора є інженерним зразком, то його маркування не збігається зі стандартним.
Процесор підтримує ряд фірмових технологій:
-
Enhanced Halt State (C1E) відключає деякі блоки процесора під час його бездіяльності, тим самим зменшуючи енергоспоживання та тепловиділення;
-
Enhanced Intel Speedstep Technology дозволяє зменшувати напругу живлення та тактову частоту під час низького навантаження на процесор;
-
Execute Disable Bit - підтримка програмно-апаратного механізму захисту від переповнення буфера, механізму, який використовують більшість шкідливих програм-вірусів для завдання збитків або проникнення в систему;
-
Intel Virtualization Technology дає можливість віртуальним машинам одержувати доступ до апаратних ресурсів;
-
Hyper-Threading Technology - кожне з чотирьох ядер процесора Intel Core i7 підтримує одночасне виконання двох програмних потоків;
-
Intel Turbo Boost Technology - дозволяє збільшувати множник процесора залежно від навантаження, фактично являє собою функцію динамічного розгону.
Утиліта CPU-Z версії 1.52.1 коректно відображає основні характеристики процесора Intel Core i7-860, а також властивості оновленої підсистеми пам'яті.
Інтегрований контролер пам'яті DDR3 під час тестування працював у двоканальному режимі на частоті 1333 МГц.
Під час рівномірного навантаження технологія Intel Turbo Boost збільшує частоту до 3 ГГц, за рахунок збільшення множника.
Тестування продуктивності
При тестуванні використовувався Стенд для тестування Процесорів №1
Материнська плата (AMD) |
GIGABYTE GA-MA790XT-UD4P (AMD 790X, sAM3, DDR3, ATX) |
Кулер (AMD) |
Thermaltake Sonic Tower (CL-P0071) + akasa AK-183-L2B 120 мм |
Материнські плати (Intel) |
GIGABYTE GA-EP45-UD3P (Intel P45, LGA 775, DDR2, ATX) |
Кулер (Intel) |
Noctua NH-U12P + LGA1366 Kit |
Оперативна пам'ять |
2х DDR2-1200 1024 МБ Kingston Hyper KHX9600D2K2/2G |
Відеокарти |
EVGA e-GeForce 8600 GTS 256 МБ GDDR3 PCI-E |
Жорсткий диск |
Seagate Barracuda 7200.12 ST3500418AS, 500 ГБ, SATA-300, NCQ |
Блок живлення |
Seasonic SS-650JT, 650 Вт, Active PFC, 80 PLUS, 120 мм вентилятор |
Судячи з результатів тестів, виконавчі вузли процесора на ядрі Lynnfield не перетерпіли будь-яких помітних змін у порівнянні з ядром Bloomfield, тому що в завданнях не сильно вимогливих до пропускної здатності оперативної пам'яті процесор Intel Core i7-860 з частотою 2,8 ГГц завжди випереджає Intel Core i7-920 з частотою 2,66 ГГц. І тільки деякі додатки на останньому одержують деяке збільшення у швидкодії внаслідок наявності більш продуктивного контролера пам'яті. В такій ситуації, при приблизно рівній вартості процесорів і появі недорогих плат на Intel P55 Express, нова платформа буде виглядати помітно привабливіше рішень для екстремальних геймерів та ентузіастів на основі Intel X58 Express.
Що стосується порівняння з платформою попереднього покоління, до складу якої входить процесор Intel Core 2 Quad Q9550, що працює на частоті 2,83 ГГц, то по продуктивності рішення нового покоління виглядає набагато вигідніше. Хоча співвідношення продуктивність/ціна у платформи Intel LGA1156, принаймні перший час, через спекуляцію новинкою, не найкраще. Крім того, у найближчому майбутньому, найімовірніше, компанії Intel доведеться знімати з виробництва старші моделі Core 2 Quad, і тоді подібне питання перестане бути актуальним.
А ось порівняння з однією зі старших моделей лінійки Phenom II X4 від компанії-конкурента AMD показує результати явно не на користь її розробки. Процесор AMD Phenom II X4 955, працюючи на частоті 3,2 ГГц, програє за продуктивністю практично у всіх завданнях, іноді суттєво. Але, з іншого боку, цей процесор вже давно доступний, має на третину меншу вартість і може бути встановлений у безліч доступних у роздріб материнських плат, які в переважній більшості будуть мати помітно меншу вартість, ніж навіть молодші рішення на Intel P55 Express. Тому платформа AMD продовжує бути більш прийнятною за співвідношенням продуктивність/ціна. Але якщо потрібна просто максимально висока продуктивність при розумних витратах, то платформа Intel LGA1156 повинна стати найбільш перспективною. Треба тільки трошки почекати поки вляжеться ажіотаж, на якому більшість бажають заробити.
Але перш ніж робити попередні висновки, треба досліджувати деякі особливості архітектури та спробувати зробити розгін.
Вплив пропускної здатності оперативної пам'яті на продуктивність
Під час розширеного тестування процесора Intel Core i7-920 ми виявили, що продуктивність архітектури Nehalem не сильно залежить від швидкості та режиму роботи оперативної пам'яті. Цього разу ми були дещо обмежені за часом проведення тестів і тому обмежимося тільки перевіркою необхідності у двоканальному режимі роботи пам'яті. Що буде якщо встановити модулі пам'яті невірно та вони запрацюють в одноканальному режимі?
Тестовий пакет |
Результат |
Падіння продуктивності, % | ||
2 Channel |
1 Channel | |||
Futuremark PCMark'05 |
CPU |
9070 |
9015 |
-0,61 |
Memory |
8907 |
8437 |
-5,28 | |
Graphics |
9343 |
9321 |
-0,24 | |
CrystalMark |
ALU |
51753 |
51594 |
-0,31 |
FPU |
51014 |
50957 |
-0,11 | |
Memory |
39871 |
23758 |
-40,41 | |
WinRar, Kb/s |
3086 |
2498 |
-19,05 | |
Futuremark 3DMark'06 |
Mark Score |
6542 |
6533 |
-0,14 |
CPU Score |
4956 |
4849 |
-2,16 |
Як бачимо, ситуація повторюється - найбільш чутливими до пропускної здатності пам'яті виявляються синтетичні тести та ресурсномісткі завдання, а в інших випадках можна і не помітити різницю у швидкодії.
Вплив технології Hyper-Threading на продуктивність
Ми вже не раз відзначали, що, незважаючи на те, що багатопоточні обчислення, багатоядерні процесори та сама технологія Hyper-Threading з'явилися дуже давно, більшість додатків дотепер не оптимізовані належним чином. Тому, якщо відключити підтримку Hyper-Threading в BIOS, то в більшості завдань, найімовірніше, продуктивність залишиться незмінною, а в деяких навіть може зрости внаслідок невірно реалізованої підтримки багатопоточних обчислень. Перевіримо?
Тестовий пакет |
Результат |
Зміна продуктивності, % | ||
Hyper-Threading ON |
Hyper-Threading OFF | |||
Futuremark PCMark'05 |
CPU |
9070 |
8973 |
-1,07 |
Memory |
8907 |
8905 |
-0,02 | |
Graphics |
9343 |
9381 |
0,41 | |
CrystalMark |
ALU |
51753 |
67319 |
30,08 |
FPU |
51014 |
53831 |
5,52 | |
Memory |
39871 |
42201 |
5,84 | |
WinRar, Kb/s |
3086 |
2343 |
-24,08 | |
Futuremark 3DMark'06 |
Mark Score |
6542 |
6497 |
-0,69 |
CPU Score |
4956 |
4526 |
-8,68 |
Як бачите, результат був цілком передбачуваним, більшість завдань майже не помітили різницю, включена Hyper-Threading чи ні, а деякі навіть прискорилися. Але дані результати аж ніяк не кажуть про марність Hyper-Threading - багато нових додатків вже добре оптимізовані для розпаралелювання обчислень та в них можна чекати помітну користь від даної технології. Тут хочеться нагадати слайд з презентації нових процесорів:
Будемо сподіватися, що згодом буде все більше програмних продуктів, у яких включення підтримки Hyper-Threading не тільки не буде приводити до падіння швидкодії, а і буде помітно прискорювати їх роботу. Напевно, тому підтримкою Hyper-Threading поки можуть похвастатися тільки моделі лінійки Core i7, які більше підходять для використання в робочих станціях, ПЗ для яких швидше та краще оптимізується під нові можливості, інструкції та багатопоточність.
Масштабованість архітектури
Для того, щоб оцінити масштабованість процесорів на ядрі Lynnfield, тобто перспективність появи більш швидких і більш повільних моделей, ми повторили тести процесора при різних множниках. На жаль, модель Intel Core i7-860 має заблокований вбік збільшення множник, але подібне дослідження можна робити і при зменшенні тактової частоти, так би мовити проводячи тестування майбутніх молодших моделей.
В результаті можна сказати, що збільшення тактової частоти ядра Lynnfield на один крок, який дорівнює 133 МГц, забезпечує приріст продуктивності приблизно на 4,5%, тому на актуальність вартості більш швидких і повільних рішень варто дивитися крізь призму зміни продуктивності. З іншого боку, обчислювальні завдання аж до частоти 2,8 ГГц мають лінійну залежність, тобто продуктивність системи не обмежена іншими факторами, а значить поява більш швидких процесорів серії Intel Core i7 800 досить перспективна, але практичність таких моделей буде залежати від вартості.
Розгінний потенціал
До перших експериментів по розгону процесорів на ядрі Lynnfield було важко судити про їх розгінний потенціалі, тому що в ньому додалася кількість виконавчих блоків, які повинні працювати стабільно, хоча нічого іншого, перешкоджаючому нарощуванню частоти, в ньому немає. Тому, озброївшись досвідом розгону процесорів на ядрі Bloomfield, ми спробували знайти максимальну стабільну частоту процесора Intel Core i7-860, який потрапив до нас.
При напрузі живлення ядра майже 1,3 В ми досягли стабільності на частоті 4074 МГц, яка на ≈1200 МГц більше номінальної частоти. Таким чином, розгін склав близько 42%, що є гарним результатом і повинно помітно позначитися на продуктивності всієї системи.
Тестовий пакет |
Результат |
Приріст продуктивності, % | ||
Номінальна частота |
Розігнаний процесор | |||
Futuremark PCMark'05 |
CPU |
9070 |
12859 |
41,78 |
Memory |
8907 |
12335 |
38,49 | |
Graphics |
9343 |
10479 |
12,16 | |
CrystalMark |
ALU |
51753 |
74564 |
44,08 |
FPU |
51014 |
73751 |
44,57 | |
Memory |
39871 |
44162 |
10,76 | |
WinRar, Kb/s |
3086 |
3675 |
19,09 | |
Futuremark 3DMark'06 |
Mark Score |
6542 |
6693 |
2,31 |
CPU Score |
4956 |
6854 |
38,30 | |
Fritz Chess Benchmark v.4.2, knodes/s |
10569 |
14782 |
39,86 |
Цілком очікувано, що обчислювальні завдання майже прямо пропорційно залежать від тактової частоти процесора (і пропускної здатності пам'яті, що теж збільшилося при розгоні), але більш комплексні додатки внаслідок розгону прискорюються не так помітно, але, все-таки, в більшості випадків відчутно. Сподіваємося, і серійні процесори будуть мати як мінімум такий же розгінний потенціал, що додасть їм привабливості та збільшить аудиторію за рахунок любителів розгону.
Попередні підсумки
На прикладі інженерного семпла процесора Intel Core i7-860 ми змогли оцінити можливості нової масової реалізації мікроархітектури Nehalem. Найімовірніше, саме такою вона повинна була бути початково. Тобто замість дорогої та громіздкої зв'язки з Intel X58 Express та Intel Core i7-900, які, по суті, є перетвореною для домашнього використання серверною платформою, варто ще рік тому очікувати більш доступних і компактних, а головне більш енегоефективних рішень. Саме так і виглядають процесори на ядрі Lynnfield, одну з реалізацій якого - Intel Core i7-860 – ми і змогли сьогодні протестувати. Нова архітектура в плані чистої продуктивності помітно перевершує рішення попереднього покоління та пропозиції конкурента навіть з більшою робочою тактовою частотою. При цьому процесори не сильно вимогливі до пропускної здатності оперативної пам'яті, мають перспективи масштабованості та відрізняються гарним розгінним потенціалом. Але про повну перевагу над конкурентом і попередниками поки казати рано, тому що не тільки рекомендовані ціни не здаються доступними всім, особливо на старші моделі, але і поки є ажіотаж з новинкою, нерідкі випадки спекулювання при дефіциті, що створився.
Отже, мы даним матеріалом не закриваємо тему тестування оновленої мікроархітектури Nehalem і процесорів на ядрі Lynnfield, а очікуємо незабаром у тестовій лабораторії коробкові версії нових процесорів, щоб провести більш повне та глибоке тестування, що допоможе відповісти на ряд не розкритих поки питань...
Автори: Дмитро Масюк, Олександр Черноіван
Переклад: Анна Смірнова
Висловлюємо подяку компаніям ASUS, GIGABYTE, Kingston, Noctua, Sea Sonic, Scythe, VIZO за надане для тестового стенда обладнання.
Опубліковано : 12-09-2009
Підписатися на наші канали | |||||