Google научила Gemini 2.5 понимать интонации и передавать эмоций в диалогах

  • 08.06.2025 17:38
  • 1.6k+

На конференции Google I/O 2025 представлена обновлённая версия мультимодальной ИИ-модели Gemini 2.5. Теперь она умеет в режиме реального времени генерировать аудио и вести диалог с учётом эмоций. Доступ к функциям открыт для разработчиков через Google AI Studio и Vertex AI.

Gemini 2.5 Flash Preview обеспечивает реалистичное голосовое взаимодействие. Модель распознаёт эмоциональную окраску речи, может адаптировать интонацию и акцент, а также переключаться между более чем 24 языками. Она умеет подавлять фоновый шум и обращаться к внешним ресурсам, таким как «Поиск», для получения информации во время диалога.
Также улучшены функции синтеза речи (TTS). Пользователи могут управлять стилем, темпом и эмоциональной выразительностью озвучивания. Поддерживается генерация диалогов с несколькими голосами, что позволяет применять модель для создания подкастов, аудиокниг и других медиапроектов.
Для прозрачности используется технология SynthID, которая маркирует сгенерированное аудио как продукт ИИ. Новые возможности доступны во вкладках Stream и Generate Media в Google AI Studio.
Gemini 2.5 объединяет работу с текстами, изображениями, аудио и видео, расширяя потенциал интерактивных приложений, виртуальных помощников и образовательных решений.


07.12.2025 12:29
4.1k+

Перспективы внедрения национальных технологий ИИ обсудили на форуме в Ашхабаде

В Ашхабаде на базе Инженерно-технологического университета Туркменистана имени Огуз хана в гибридном формате состоялась научно-практическая конференция «Национальные технологии искусственного интеллекта – инновационный инструмент экономического развития Туркменистана»...

04.12.2025 23:54
1.4k+

Google начнет строительство космических дата-центров в 2027 году

Google планирует начать строительство дата-центров в космическом пространстве уже в 2027 году. Проект под названием Suncatcher нацелен на более эффективное использование солнечной энергии для обеспечения питанием центров обработки данных (ЦОД), которые потребляют значительные объемы энергии, сообщил генеральный директор Google Сундар Пичаи...

19.11.2025 13:32
3.7k+

Все роботы с ИИ провалили испытания на безопасность для человека

Роботы, управляемые большими языковыми моделями (LLM), показали склонность к дискриминации и к одобрению действий, которые могут причинить людям физический вред. К такому выводу пришли ученые из Королевского колледжа Лондона и Университета Карнеги-Меллон по итогам совместных исследовании...

15.11.2025 00:14
8.7k+

Представлен первый в России человекоподобный робот. Он упал, сделав несколько шагов

В Москве представили первого российского человекоподобного робота с искусственным интеллектом. Об этом 11 ноября сообщил ТАСС со ссылкой на Национальную технологическую коалицию. Как сообщает агентство «Москва», робот по имени Айдол (Aidol) не удержал равновесие и упал уже в начале презентации...