Google научила Gemini 2.5 понимать интонации и передавать эмоций в диалогах

  • 08.06.2025 17:38
  • 1.4k+

На конференции Google I/O 2025 представлена обновлённая версия мультимодальной ИИ-модели Gemini 2.5. Теперь она умеет в режиме реального времени генерировать аудио и вести диалог с учётом эмоций. Доступ к функциям открыт для разработчиков через Google AI Studio и Vertex AI.

Gemini 2.5 Flash Preview обеспечивает реалистичное голосовое взаимодействие. Модель распознаёт эмоциональную окраску речи, может адаптировать интонацию и акцент, а также переключаться между более чем 24 языками. Она умеет подавлять фоновый шум и обращаться к внешним ресурсам, таким как «Поиск», для получения информации во время диалога.
Также улучшены функции синтеза речи (TTS). Пользователи могут управлять стилем, темпом и эмоциональной выразительностью озвучивания. Поддерживается генерация диалогов с несколькими голосами, что позволяет применять модель для создания подкастов, аудиокниг и других медиапроектов.
Для прозрачности используется технология SynthID, которая маркирует сгенерированное аудио как продукт ИИ. Новые возможности доступны во вкладках Stream и Generate Media в Google AI Studio.
Gemini 2.5 объединяет работу с текстами, изображениями, аудио и видео, расширяя потенциал интерактивных приложений, виртуальных помощников и образовательных решений.


27.06.2025 11:29
2.5k+

Поисковик Google начал подстраиваться лично под каждого пользователя

Google начала внедрять в AI Mode своего поисковика персонализированные подсказки. Теперь в мобильном приложении компании при переходе к этому режиму пользователи видят рекомендации, основанные на их активности в Google...

25.06.2025 10:59
4.5k+

Маск заявил, что новая версия Grok получит «все знания человечества»

Илон Маск заявил, что новая версия искусственного интеллекта Grok должна вобрать в себя «все человеческие знания». Об этом он написал в социальной сети X, отметив, что его ИИ будет отличаться от решений конкурентов благодаря другим исходным данным для обучения...

25.06.2025 10:13
3.8k+

В России создали технологию, которая поможет отличать дипфейк от реального контента

Институт системного программирования РАН разработал систему, способную автоматически помечать контент, созданный с помощью искусственного интеллекта. Об этом сообщает РИА Новости. Технология использует цифровые метки, незаметные для человека, но легко распознаваемые компьютером...

23.06.2025 12:49
3.4k+

Исследование MIT: зависимость от ChatGPT снижает активность мозга и креативность

Ученые Массачусетского технологического института (MIT) выяснили, что чрезмерная зависимость от использования ChatGPT при работе с текстами может снижать обучаемость и критическое мышление. Об этом сообщает журнал Time со ссылкой на новое исследование...