Google научила Gemini 2.5 понимать интонации и передавать эмоций в диалогах

  • 08.06.2025 17:38
  • 1.6k+

На конференции Google I/O 2025 представлена обновлённая версия мультимодальной ИИ-модели Gemini 2.5. Теперь она умеет в режиме реального времени генерировать аудио и вести диалог с учётом эмоций. Доступ к функциям открыт для разработчиков через Google AI Studio и Vertex AI.

Gemini 2.5 Flash Preview обеспечивает реалистичное голосовое взаимодействие. Модель распознаёт эмоциональную окраску речи, может адаптировать интонацию и акцент, а также переключаться между более чем 24 языками. Она умеет подавлять фоновый шум и обращаться к внешним ресурсам, таким как «Поиск», для получения информации во время диалога.
Также улучшены функции синтеза речи (TTS). Пользователи могут управлять стилем, темпом и эмоциональной выразительностью озвучивания. Поддерживается генерация диалогов с несколькими голосами, что позволяет применять модель для создания подкастов, аудиокниг и других медиапроектов.
Для прозрачности используется технология SynthID, которая маркирует сгенерированное аудио как продукт ИИ. Новые возможности доступны во вкладках Stream и Generate Media в Google AI Studio.
Gemini 2.5 объединяет работу с текстами, изображениями, аудио и видео, расширяя потенциал интерактивных приложений, виртуальных помощников и образовательных решений.


20.10.2025 17:37
1.4k+

ИИ-модель от Google DeepMind «разговорил» раковые клетки и нашёл их слабое место

Учёные долго искали способы заставить опухоли проявляться на ранних стадиях, когда иммунная система человека ещё способна их эффективно атаковать. Теперь к этой задаче подключили искусственный интеллект, и результаты оказались впечатляющими...

18.10.2025 12:40
1.9k+

Google обновила Veo до версии 3.1: больше реализма, звука и кинематографичности

Google выпустила обновлённую версию своего ИИ-генератора видео — Veo 3.1. Новая модель отличается более реалистичным изображением, точным следованием текстовым запросам и улучшенным звуковым оформлением. По сравнению с версией, выпущенной в мае, Veo 3...

17.10.2025 00:39
2.4k+

Microsoft представила MAI-Image-1 — собственный ИИ-генератор реалистичных картинок

Компания Microsoft представила собственный генератор изображений на базе искусственного интеллекта — MAI-Image-1. Это первая модель для создания фотореалистичных картинок, полностью разработанная внутри самой корпорации...

16.10.2025 09:35
8k+

Туркменские школьники заняли второе место на соревновании Google

Ученики 12-го класса специализированной средней школы №97 города Ашхабада — Бегенч Аннаразов, Айхан Байрамов и Салых Аннанепесов — заняли второе место на соревновании Google Firebase Studio Championship Central Asia 2025...