Google научила Gemini 2.5 понимать интонации и передавать эмоций в диалогах

  • 08.06.2025 17:38
  • 1.5k+

На конференции Google I/O 2025 представлена обновлённая версия мультимодальной ИИ-модели Gemini 2.5. Теперь она умеет в режиме реального времени генерировать аудио и вести диалог с учётом эмоций. Доступ к функциям открыт для разработчиков через Google AI Studio и Vertex AI.

Gemini 2.5 Flash Preview обеспечивает реалистичное голосовое взаимодействие. Модель распознаёт эмоциональную окраску речи, может адаптировать интонацию и акцент, а также переключаться между более чем 24 языками. Она умеет подавлять фоновый шум и обращаться к внешним ресурсам, таким как «Поиск», для получения информации во время диалога.
Также улучшены функции синтеза речи (TTS). Пользователи могут управлять стилем, темпом и эмоциональной выразительностью озвучивания. Поддерживается генерация диалогов с несколькими голосами, что позволяет применять модель для создания подкастов, аудиокниг и других медиапроектов.
Для прозрачности используется технология SynthID, которая маркирует сгенерированное аудио как продукт ИИ. Новые возможности доступны во вкладках Stream и Generate Media в Google AI Studio.
Gemini 2.5 объединяет работу с текстами, изображениями, аудио и видео, расширяя потенциал интерактивных приложений, виртуальных помощников и образовательных решений.


18.08.2025 09:58
2.3k+

OpenAI вступает в территорию Neuralink. Компания инвестирует в создание мозговых чипов

Американская компания OpenAI и её соучредитель Сэм Альтман собираются инвестировать в стартап Merge Labs, который разрабатывает интерфейсы для мозговых имплантов. Об этом сообщила Financial Times со ссылкой на три анонимных источника...

16.08.2025 23:38
3.7k+

Внедрение ИИ ухудшило способность врачей диагностировать рак — The Lancet

Медики теряют навыки самостоятельной диагностики рака после нескольких месяцев использования технологий искусственного интеллекта (ИИ). К такому выводу пришли ученые в исследовании, опубликованном в британском научном журнале The Lancet...

09.08.2025 18:20
3.2k+

NASA и Google Cloud создают ИИ-врача для помощи астронавтам в космосе

NASA и Google Cloud тестируют систему искусственного интеллекта, способную помогать в постановке диагнозов и лечении астронавтов во время длительных космических миссий. Разработка получила название «Цифровой помощник врача экипажа» (CMO-DA) и создана как часть подготовки к пилотируемым полётам, начиная с миссии «Артемида» по возвращению на Луну...

09.08.2025 18:18
5.3k+

Илон Маск анонсировал запуск Grok 5 на фоне выхода новой модели OpenAI

Илон Маск заявил, что его компания xAI выпустит модель Grok 5 «до конца этого года». Анонс прозвучал вскоре после презентации OpenAI новой модели GPT-5. По словам Маска, текущая версия искусственного интеллекта xAI, Grok 4, «значительно превосходит» последнюю разработку OpenAI...