Google научила Gemini 2.5 понимать интонации и передавать эмоций в диалогах

  • 08.06.2025 17:38
  • 1.7k+

На конференции Google I/O 2025 представлена обновлённая версия мультимодальной ИИ-модели Gemini 2.5. Теперь она умеет в режиме реального времени генерировать аудио и вести диалог с учётом эмоций. Доступ к функциям открыт для разработчиков через Google AI Studio и Vertex AI.

Gemini 2.5 Flash Preview обеспечивает реалистичное голосовое взаимодействие. Модель распознаёт эмоциональную окраску речи, может адаптировать интонацию и акцент, а также переключаться между более чем 24 языками. Она умеет подавлять фоновый шум и обращаться к внешним ресурсам, таким как «Поиск», для получения информации во время диалога.
Также улучшены функции синтеза речи (TTS). Пользователи могут управлять стилем, темпом и эмоциональной выразительностью озвучивания. Поддерживается генерация диалогов с несколькими голосами, что позволяет применять модель для создания подкастов, аудиокниг и других медиапроектов.
Для прозрачности используется технология SynthID, которая маркирует сгенерированное аудио как продукт ИИ. Новые возможности доступны во вкладках Stream и Generate Media в Google AI Studio.
Gemini 2.5 объединяет работу с текстами, изображениями, аудио и видео, расширяя потенциал интерактивных приложений, виртуальных помощников и образовательных решений.


сегодня 10:29
481

В Google Maps появился режим трёхмерной навигации и чат-бот Gemini

Компания Google представила крупнейшее обновление автомобильной навигации в приложении Google Maps за последние десять лет. Новый режим Immersive Navigation заменяет привычную плоскую карту трёхмерным отображением окружающего пространства...

07.03.2026 17:10
897

OpenAI представила GPT-5.4. В нем контекстное окно увеличили до миллиона токенов

OpenAI представила новую языковую модель GPT-5.4. Разработчики продолжают развивать линейку систем искусственного интеллекта, уделяя больше внимания решению сложных задач, программированию и работе с различными инструментами...

06.03.2026 12:05
2.6k+

В GPT-5.4 появится режим экстремального рассуждения

В модели GPT-5.4 может появиться специальный режим обработки сложных запросов. Об этом сообщает издание The Information. По данным источника, в таком режиме модель будет использовать больше времени и вычислительных ресурсов для решения задач, требующих сложной логики и детального анализа...

27.02.2026 21:33
8.4k+

Новая модель Nano Banana 2 от Google получила поддержку 4K и все знания Gemini

Американская компания Google презентовала нейросеть Nano Banana 2. Разработчики называют ее «новейшей, передовой моделью обработки изображений», сообщают «Ведомости». Технология будет внедрена во все сервисы корпорации...