Google научила Gemini 2.5 понимать интонации и передавать эмоций в диалогах

  • 08.06.2025 17:38
  • 1.7k+

На конференции Google I/O 2025 представлена обновлённая версия мультимодальной ИИ-модели Gemini 2.5. Теперь она умеет в режиме реального времени генерировать аудио и вести диалог с учётом эмоций. Доступ к функциям открыт для разработчиков через Google AI Studio и Vertex AI.

Gemini 2.5 Flash Preview обеспечивает реалистичное голосовое взаимодействие. Модель распознаёт эмоциональную окраску речи, может адаптировать интонацию и акцент, а также переключаться между более чем 24 языками. Она умеет подавлять фоновый шум и обращаться к внешним ресурсам, таким как «Поиск», для получения информации во время диалога.
Также улучшены функции синтеза речи (TTS). Пользователи могут управлять стилем, темпом и эмоциональной выразительностью озвучивания. Поддерживается генерация диалогов с несколькими голосами, что позволяет применять модель для создания подкастов, аудиокниг и других медиапроектов.
Для прозрачности используется технология SynthID, которая маркирует сгенерированное аудио как продукт ИИ. Новые возможности доступны во вкладках Stream и Generate Media в Google AI Studio.
Gemini 2.5 объединяет работу с текстами, изображениями, аудио и видео, расширяя потенциал интерактивных приложений, виртуальных помощников и образовательных решений.


05.05.2026 05:26
3.1k+

ИИ научился выявлять риск СДВГ у детей на ранней стадии

Учёные показали, что искусственный интеллект может выявлять признаки синдрома дефицита внимания и гиперактивности (СДВГ) у детей за несколько лет до постановки диагноза....

18.04.2026 12:23
4.2k+

Мэн станет первым штатом США, запретившим строительство крупных дата-центров

Штат Мэн планирует первым в США заморозить строительство новых крупных дата-центров с энергопотреблением от 20 МВт до ноября 2027 года. Законопроект направлен на защиту энергосетей и оценку экологического......

22.03.2026 04:00
3.1k+

Pixel 10 Pro XL уступил Galaxy S26 по времени работы батареи, хотя у Pixel она больше на 1000 мАч

Смартфон Pixel 10 Pro XL проиграл по автономности Samsung Galaxy S26, хотя его батарея на 1000 мА·ч больше. Согласно тестам ресурса GSMArena, Galaxy S26 проработал в активном режиме около 15 часов 20 минут, а Pixel 10 Pro XL — 12 часов 29 минут...

17.03.2026 10:29
923

В Google Maps появился режим трёхмерной навигации и чат-бот Gemini

Компания Google представила крупнейшее обновление автомобильной навигации в приложении Google Maps за последние десять лет. Новый режим Immersive Navigation заменяет привычную плоскую карту трёхмерным отображением окружающего пространства...