Google научила Gemini 2.5 понимать интонации и передавать эмоций в диалогах

  • 08.06.2025 17:38
  • 1.5k+

На конференции Google I/O 2025 представлена обновлённая версия мультимодальной ИИ-модели Gemini 2.5. Теперь она умеет в режиме реального времени генерировать аудио и вести диалог с учётом эмоций. Доступ к функциям открыт для разработчиков через Google AI Studio и Vertex AI.

Gemini 2.5 Flash Preview обеспечивает реалистичное голосовое взаимодействие. Модель распознаёт эмоциональную окраску речи, может адаптировать интонацию и акцент, а также переключаться между более чем 24 языками. Она умеет подавлять фоновый шум и обращаться к внешним ресурсам, таким как «Поиск», для получения информации во время диалога.
Также улучшены функции синтеза речи (TTS). Пользователи могут управлять стилем, темпом и эмоциональной выразительностью озвучивания. Поддерживается генерация диалогов с несколькими голосами, что позволяет применять модель для создания подкастов, аудиокниг и других медиапроектов.
Для прозрачности используется технология SynthID, которая маркирует сгенерированное аудио как продукт ИИ. Новые возможности доступны во вкладках Stream и Generate Media в Google AI Studio.
Gemini 2.5 объединяет работу с текстами, изображениями, аудио и видео, расширяя потенциал интерактивных приложений, виртуальных помощников и образовательных решений.


27.08.2025 15:44
4.9k+

Китай строит первый в мире подводный дата-центр для искусственного интеллекта

В Китае ведется строительство первого в мире подводного центра обработки данных для искусственного интеллекта. Объект находится в 10 км от побережья Шанхая, а его питание будет обеспечивать близлежащая морская ветроэлектростанция, передает Live Science...

22.08.2025 08:10
1k+

Google добавила в Gemini инструмент для озвучивания документов

Разработчики Google внедрили в сервис «Google Документы» новую функцию, позволяющую преобразовывать текст в аудиоформат. Инструмент работает на базе модели искусственного интеллекта Gemini. Опция «Аудио» появилась в меню «Инструменты» в верхней части рабочего пространства...

21.08.2025 16:21
1.7k+

Первый в космосе ИИ-ассистент: Китай вывел на орбиту систему «Укун»

Китайские астронавты на станции «Тяньгун» получили первого ИИ-помощника. Система под названием «Укун», созданная на базе отечественной открытой модели, была доставлена на станцию грузовым кораблем «Тяньчжоу-9» вместе с новыми скафандрами, фруктами и другими запасами...

18.08.2025 09:58
3.1k+

OpenAI вступает в территорию Neuralink. Компания инвестирует в создание мозговых чипов

Американская компания OpenAI и её соучредитель Сэм Альтман собираются инвестировать в стартап Merge Labs, который разрабатывает интерфейсы для мозговых имплантов. Об этом сообщила Financial Times со ссылкой на три анонимных источника...