Комп'ютерні новини
Всі розділи
Google представила звукову ШІ-модель Gemini 3.5 Live Translate для синхронного перекладу
Google презентувала нову спеціалізовану модель Gemini 3.5 Live Translate, створену для двостороннього голосового перекладу в режимі реального часу.
Ключовою особливістю нейромережі є здатність повністю зберігати оригінальну інтонацію, темп мовлення та висоту голосу спікера. На відміну від класичних систем, які очікують завершення фрази, ця модель обробляє аудіопотік синхронно. Затримка становить усього кілька секунд, що дозволяє уникнути неприродних пауз під час розмови.
Нейромережа автоматично розпізнає понад 70 мов і адаптована для стабільної роботи в шумних умовах. З метою безпеки та захисту від дезінформації всі згенеровані аудіозаписи маркуються цифровим водяним знаком SynthID. Розробники вже отримали доступ до інструменту у форматі публічної попередньої версії через Gemini Live API та Google AI Studio. Технологію інтегрують такі платформи як Agora, LiveKit та Vision Agents, а азіатський сервіс таксі Grab уже тестує її для спілкування між водіями та клієнтами.
Для корпоративних клієнтів закрите тестування розпочнеться цього місяця у сервісі Google Meet для підписників Workspace, де оновлення підтримуватиме понад 2000 мовних комбінацій. Повноцінний бізнес-реліз заплановано на кінець 2026 року.
Звичайні користувачі зможуть скористатися функцією завдяки глобальному оновленню застосунку Google Translate для iOS та Android, яке транслюватиме перекладений звук безпосередньо в навушники.










