Google научила Gemini 2.5 понимать интонации и передавать эмоций в диалогах

  • 08.06.2025 17:38
  • 1.7k+

На конференции Google I/O 2025 представлена обновлённая версия мультимодальной ИИ-модели Gemini 2.5. Теперь она умеет в режиме реального времени генерировать аудио и вести диалог с учётом эмоций. Доступ к функциям открыт для разработчиков через Google AI Studio и Vertex AI.

Gemini 2.5 Flash Preview обеспечивает реалистичное голосовое взаимодействие. Модель распознаёт эмоциональную окраску речи, может адаптировать интонацию и акцент, а также переключаться между более чем 24 языками. Она умеет подавлять фоновый шум и обращаться к внешним ресурсам, таким как «Поиск», для получения информации во время диалога.
Также улучшены функции синтеза речи (TTS). Пользователи могут управлять стилем, темпом и эмоциональной выразительностью озвучивания. Поддерживается генерация диалогов с несколькими голосами, что позволяет применять модель для создания подкастов, аудиокниг и других медиапроектов.
Для прозрачности используется технология SynthID, которая маркирует сгенерированное аудио как продукт ИИ. Новые возможности доступны во вкладках Stream и Generate Media в Google AI Studio.
Gemini 2.5 объединяет работу с текстами, изображениями, аудио и видео, расширяя потенциал интерактивных приложений, виртуальных помощников и образовательных решений.


21.02.2026 17:41
1.5k+

Gemini 3.1 Pro оказалась умнее конкурентов, и к тому же заметно дешевле

Google представила новую ИИ-модель Gemini 3.1 Pro, предназначенную для задач, где требуется сложное логическое рассуждение, а не короткий ответ. Модель способна писать приложения, проводить исследования и даже создавать анимации...

21.02.2026 14:09
1k+

Google изменила интерфейс ИИ-поиска после жалоб издателей

Google внесла изменения в отображение гиперссылок в разделах «Обзор от ИИ» (AI Overviews) и «Режиме ИИ» на базе Gemini, сообщает вице-президент по продукту Google Search Робби Стейн. Решение принято на фоне критики со стороны владельцев сайтов, фиксирующих падение поискового трафика...

20.02.2026 12:19
1.9k+

Google представила «самый прочный» Pixel 10a

Компания Google представила новый бюджетный смартфон Pixel 10a. Глобальные продажи устройства начнутся 5 марта. В Google заявили, что Pixel 10a стал самым прочным смартфоном в линейке. Устройство получило защиту от воды и пыли по стандарту IP68...

19.02.2026 20:07
1.4k+

OpenAI внедрила в ChatGPT «режим блокировки» и пометку «повышенный риск»

Компания OpenAI объявила о запуске новых функций безопасности для продуктов на базе искусственного интеллекта — «режима блокировки» (Lockdown Mode) и маркировки «повышенный риск» (Elevated Risk). Нововведения затрагивают ChatGPT, ChatGPT Atlas и Codex...