Google научила Gemini 2.5 понимать интонации и передавать эмоций в диалогах

  • сегодня 17:38
  • 442

На конференции Google I/O 2025 представлена обновлённая версия мультимодальной ИИ-модели Gemini 2.5. Теперь она умеет в режиме реального времени генерировать аудио и вести диалог с учётом эмоций. Доступ к функциям открыт для разработчиков через Google AI Studio и Vertex AI.

Gemini 2.5 Flash Preview обеспечивает реалистичное голосовое взаимодействие. Модель распознаёт эмоциональную окраску речи, может адаптировать интонацию и акцент, а также переключаться между более чем 24 языками. Она умеет подавлять фоновый шум и обращаться к внешним ресурсам, таким как «Поиск», для получения информации во время диалога.
Также улучшены функции синтеза речи (TTS). Пользователи могут управлять стилем, темпом и эмоциональной выразительностью озвучивания. Поддерживается генерация диалогов с несколькими голосами, что позволяет применять модель для создания подкастов, аудиокниг и других медиапроектов.
Для прозрачности используется технология SynthID, которая маркирует сгенерированное аудио как продукт ИИ. Новые возможности доступны во вкладках Stream и Generate Media в Google AI Studio.
Gemini 2.5 объединяет работу с текстами, изображениями, аудио и видео, расширяя потенциал интерактивных приложений, виртуальных помощников и образовательных решений.


25.05.2025 19:41
1.2k+

Google создала инструмент для проверки ИИ-контента

На конференции Google I/O 2025 компания представила SynthID Detector — специальный портал для проверки цифрового контента, созданного с помощью искусственного интеллекта. SynthID Detector позволяет определить, был ли загруженный файл создан с использованием ИИ-инструментов Google...

23.05.2025 19:17
3.5k+

Японские ученые научили ИИ выявлять тромбы до их образования

Учёные Токийского университета представили метод, позволяющий в режиме реального времени отслеживать образование тромбов в крови без сложных анализов. Разработка основана на комбинации микроскопа нового поколения и алгоритмов искусственного интеллекта...

20.05.2025 07:41
1.1k+

Autonomous представила миниатюрный дата-центр для локального запуска ИИ-моделей

Компания Autonomous Inc. выпустила новую рабочую станцию Brainy — компактное и мощное устройство для локального запуска и обучения ИИ-моделей без облака. В отличие от обычных ПК, Brainy способен поддерживать до восьми видеокарт RTX 4090 и обеспечивает производительность свыше петафлопса...

18.05.2025 21:56
2.8k+

В Гарварде искусственный интеллект применяют в поиске инопланетян

Гарвардский университет использует искусственный интеллект в рамках проекта «Галилео» для поиска признаков внеземной жизни. Об этом пишет Bloomberg. Таким проектом руководит доктор Лора Домине. Ранее она занималась нейтрино — элементарными частицами, которые почти невозможно зафиксировать...