Google научила Gemini 2.5 понимать интонации и передавать эмоций в диалогах

  • 08.06.2025 17:38
  • 1.7k+

На конференции Google I/O 2025 представлена обновлённая версия мультимодальной ИИ-модели Gemini 2.5. Теперь она умеет в режиме реального времени генерировать аудио и вести диалог с учётом эмоций. Доступ к функциям открыт для разработчиков через Google AI Studio и Vertex AI.

Gemini 2.5 Flash Preview обеспечивает реалистичное голосовое взаимодействие. Модель распознаёт эмоциональную окраску речи, может адаптировать интонацию и акцент, а также переключаться между более чем 24 языками. Она умеет подавлять фоновый шум и обращаться к внешним ресурсам, таким как «Поиск», для получения информации во время диалога.
Также улучшены функции синтеза речи (TTS). Пользователи могут управлять стилем, темпом и эмоциональной выразительностью озвучивания. Поддерживается генерация диалогов с несколькими голосами, что позволяет применять модель для создания подкастов, аудиокниг и других медиапроектов.
Для прозрачности используется технология SynthID, которая маркирует сгенерированное аудио как продукт ИИ. Новые возможности доступны во вкладках Stream и Generate Media в Google AI Studio.
Gemini 2.5 объединяет работу с текстами, изображениями, аудио и видео, расширяя потенциал интерактивных приложений, виртуальных помощников и образовательных решений.


01.02.2026 11:42
1.7k+

Google DeepMind создала инструмент, предсказывающий наследственные заболевания

Компания Google DeepMind представила ИИ-инструмент AlphaGenome, предназначенный для выявления генетических факторов возникновения заболеваний. Модель способна единовременно анализировать до 1 млн знаков ДНК-кода, что поможет при разработке новых терапевтических методов, сообщает The Guardian...

01.02.2026 10:54
931

YouTube начала чистку ИИ-контента

YouTube начал удалять низкокачественный контент, созданный с использованием искусственного интеллекта. Из-за этого с платформы уже исчезли два крупных канала, сообщает The Verge. По данным отчёта сервиса для видеомонтажа Kapwing, был удалён канал CuentosFacianantes с аудиторией 5,9 млн подписчиков...

31.01.2026 09:49
2.3k+

Математики доказали невозможность превосходства ИИ над человеческим интеллектом

Математические доказательства подтверждают неспособность больших языковых моделей (LLM) выполнять задачи выше определенного уровня сложности. В исследовании Вишала и Варина Сикка утверждается, что ИИ-агенты сталкиваются с теоретическим барьером, который препятствует достижению полной автономности и превосходства над человеком...

30.01.2026 22:56
785

OpenAI запустила Prism — бесплатный ИИ для курсовых и научных работ

OpenAI представила Prism — бесплатный ИИ-сервис для работы над научными исследованиями, курсовыми работами и схожими проектами. Инструмент доступен всем пользователям ChatGPT и интегрирован с моделью GPT-5.2. В компании подчёркивают, что Prism создан для помощи человеку, а не для его замены...