Google научила Gemini 2.5 понимать интонации и передавать эмоций в диалогах

  • 08.06.2025 17:38
  • 1.5k+

На конференции Google I/O 2025 представлена обновлённая версия мультимодальной ИИ-модели Gemini 2.5. Теперь она умеет в режиме реального времени генерировать аудио и вести диалог с учётом эмоций. Доступ к функциям открыт для разработчиков через Google AI Studio и Vertex AI.

Gemini 2.5 Flash Preview обеспечивает реалистичное голосовое взаимодействие. Модель распознаёт эмоциональную окраску речи, может адаптировать интонацию и акцент, а также переключаться между более чем 24 языками. Она умеет подавлять фоновый шум и обращаться к внешним ресурсам, таким как «Поиск», для получения информации во время диалога.
Также улучшены функции синтеза речи (TTS). Пользователи могут управлять стилем, темпом и эмоциональной выразительностью озвучивания. Поддерживается генерация диалогов с несколькими голосами, что позволяет применять модель для создания подкастов, аудиокниг и других медиапроектов.
Для прозрачности используется технология SynthID, которая маркирует сгенерированное аудио как продукт ИИ. Новые возможности доступны во вкладках Stream и Generate Media в Google AI Studio.
Gemini 2.5 объединяет работу с текстами, изображениями, аудио и видео, расширяя потенциал интерактивных приложений, виртуальных помощников и образовательных решений.


вчера 18:23
1.4k+

В Google Фото появились функции для оживления снимков и их стилизации

Сервис Google Фото получил обновление с новыми функциями на базе искусственного интеллекта. Пользователи смогут превращать статичные снимки в шестисекундные видеоролики и применять к изображениям различные визуальные стили, такие как аниме, комиксы, эскизы и 3D-анимация, пишет издание TechCrunch...

20.07.2025 13:44
1.6k+

ИИ-агент в ChatGPT начал выполнять задачи на компьютере от имени пользователя

Компания OpenAI представила новый ИИ-инструмент в ChatGPT, позволяющий доверить ему выполнение компьютерных задач от имени пользователя. Об этом сообщили разработчики сервиса. Новый агент может автоматически управлять календарём, создавать презентации и самостоятельно запускать код...

13.07.2025 19:08
3.2k+

В OpenAI хотят создать принципиально новый компьютер. Имеющиеся не заточены под ИИ

Генеральный директор OpenAI Сэм Альтман заявил, что современные компьютеры были созданы для мира без искусственного интеллекта и больше не соответствуют его требованиям. По его словам, компания разрабатывает принципиально новое устройство, способное учитывать контекст и принимать обоснованные решения...

07.07.2025 13:17
2.2k+

ChatGPT удивил способностью управлять космическим кораблем

ChatGPT оказался способен управлять космическим кораблём — он занял второе место в соревновании по пилотированию в симуляции Kerbal Space Program Differential Games. Об этом сообщает Live Science. Соревнование начали проводить в 2023 году в том числе по инициативе Массачусетского технологического института...