Комп'ютерні новини
Всі розділи
NVIDIA на GTC 2016: анонс мікроархітектури NVIDIA Pascal і ряд інших інновацій
В каліфорнійському місті Сан-Хосе успішно стартувала GPU Technology Conference (GTC), у рамках якої компанія NVIDIA зробила ряд важливих анонсів своїх майбутніх продуктів. У першу чергу багатьох цікавить мікроархітектура NVIDIA Pascal, тому з неї й почнемо.
NVIDIA Tesla P100
Першим офіційним анонсом нової мікроархітектури стали не масові користувацькі відеокарти, а прискорювач для надмасштабованих дата-центрів − NVIDIA Tesla P100. З його допомогою можна створювати новий клас серверів із продуктивністю рівня кількох сотень класичних серверів на базі CPU. Потужності подібних рішень буде достатньо для нового покоління наукових додатків і завдань, пов'язаних зі штучним інтелектом, для яких потрібні надефективні, ультрашвидкісні серверні вузли.
Модель NVIDIA Tesla P100 використовує п'ять передових технологій для забезпечення високої продуктивності й ефективності використання ресурсів:
- Мікроархітектура NVIDIA Pascal підвищує швидкість навчання нейронних мереж в 12 разів у порівнянні з рішеннями на базі NVIDIA Maxwell.
- Високошвидкісний інтерфейс NVIDIA NVLink використовується для зв'язку між кількома графічними процесорами. Він більш ефективно розподіляє навантаження між GPU, збільшуючи пропускну здатність в 5 разів у порівнянні із кращими на сьогодні рішеннями в даному класі. NVIDIA NVLink дозволяє зв'язати до восьми GPU NVIDIA Tesla P100. IBM уже впровадила цей інтерфейс у свої процесори POWER8 для високошвидкісної комунікації між CPU і GPU.
- 16-нм FinFET-технологія дозволила інтегрувати в процесор 15,3 млрд. транзисторів, що гарантує найвищу продуктивність і енергоефективність.
- Інноваційний підхід до побудови пам'яті CHIP-ON-WAFER-ON-SUBSTRATE (CoWoS) з HBM2 підвищує пропускну здатність в 3 рази (до 720 ГБ/с) у порівнянні з архітектурою NVIDIA Maxwell.
- Нові алгоритми штучного інтелекту забезпечують пікову продуктивність понад 21 TFLOPS у завданнях глибокого навчання.
Використання прискорювача NVIDIA Tesla P100 дозволяє досягнути феноменальних результатів. Наприклад, додаток молекулярної динаміки AMBER працює швидше на одному сервері з NVIDIA Tesla P100, аніж на 48 звичайних двосокетних серверних вузлах. А для навчання популярної глибокої нейронної мережі AlexNet буде потрібно 250 двосокетних серверних вузлів, щоб досягнути продуктивності восьми GPU NVIDIA Tesla P100.
Ключові характеристики NVIDIA Tesla P100:
Модель |
NVIDIA Tesla P100 |
Тип пам'яті |
CoWoS HBM2 |
Об’єм пам'яті |
16 ГБ |
Смуга пропускання |
720 ГБ/с |
Інтерфейс |
Двонаправлений NVIDIA NVLink |
Пропускна здатність інтерфейсу |
160 ГБ/с |
Швидкість обчислень подвійної точності |
5,3 TFLOPS |
Швидкість обчислень одинарної точності |
10,6 TFLOPS |
Швидкість обчислень половинної точності |
21,2 TFLOPS |
Додаткові переваги |
Поліпшена програмованість із рушієм переходу по сторінках і уніфікованою пам'яттю |
Оновлення в NVIDIA SDK
Підвищена обчислювальна потужність і розширені функціональні можливості потребували оновлення платформи NVIDIA SDK. У число ключових змін входить NVIDIA CUDA 8. Новітня версія платформи паралельних обчислень NVIDIA надає розробникам прямий доступ до нових можливостей мікроархітектури NVIDIA Pascal, включаючи уніфіковану пам'ять та інтерфейс NVIDIA NVLink. Крім того, в актуальний реліз входить бібліотека аналізу графів nvGRAPH, яку можна використовувати для розрахунків траєкторій, інформаційної безпеки й аналізу логістики, яка включає в сферу застосування GPU-прискорених обчислень аналітику Big Data.
Для мереж глибокого навчання NVIDIA анонсувала GPU-прискорювану бібліотеку примітивів cuDNN версії 5. Вона включає в себе підтримку GPU NVIDIA Pascal, прискорення рекуррентних нейронних мереж, використовуваних для відео й інших послідовних даних, а також ряд поліпшень, призначених для застосування в медичній, нафтогазовій та інших областях промисловості. cuDNN прискорює роботу ведучих фреймворків глибокого навчання, включаючи TensorFlow від Google, Caffe від Університету Берклі, Theano від Університету Монреаля та Torch від Нью-Йоркського Університету, які, у свою чергу, знаходяться в основі рішень від Amazon, Facebook, Google та інших компаній.
NVIDIA DGX-1
NVIDIA DGX-1 – це перший у світі суперкомп'ютер для глибокого навчання, який має достатню обчислювальну потужність для розвитку штучного інтелекту (ШІ). Він розроблений спеціально для завдань глибокого навчання (Deep Learning). Система NVIDIA DGX-1 оснащена всім необхідним апаратним і програмним забезпеченням для глибокого навчання й інструментами розробки для швидкого та легкого розгортання.
В основі новинки знаходяться графічні прискорювачі NVIDIA Tesla P100 з високошвидкісним інтерфейсом NVIDIA NVLink і 16 ГБ пам'яті CoWoS HBM2. У результаті обчислювальну потужність NVIDIA DGX-1 можна зіставити з 250 традиційними серверами на базі CPU.
У свою чергу набір комплектного ПЗ містить у собі NVIDIA Deep Learning GPU Training System (DIGITS), повноцінну інтерактивну систему для створення глибоких нейронних мереж (DNN), а також NVIDIA CUDA Deep Neural Network (cuDNN) версії 5 − GPU-прискорювану бібліотеку примітивів для створення DNN.
В США системи глибокого навчання NVIDIA DGX-1 будуть доступні прямо в NVIDIA і у деяких партнерів у червні, в інших регіонах − у третьому кварталі поточного року. Також очікується, що прискорювач NVIDIA Tesla P100 з'явиться в складі серверів від провідних виробників на початку 2017 року.
Ключові характеристики системи NVIDIA DGX-1:
Назва |
NVIDIA DGX-1 |
Використовувані прискорювачі |
8 х NVIDIA Tesla P100 |
Об’єм пам'яті кожного прискорювача |
16 ГБ |
Інтерфейс |
NVLink Hybrid Cube Mesh |
Постійна пам'ять |
7 ТБ SSD |
Пікова продуктивність обчислень половинної точності |
170 TFLOPS |
Мережеві інтерфейси |
Dual 10 GbE, Quad InfiniBand 100Gb |
Формат |
3U |
Потужність |
3200 Вт |