Компания Google представила три значительных обновления для своих продуктов на базе искусственного интеллекта Gemini.
Главным нововведением стала возможность чат-бота Gemini расшифровывать аудиозаписи — одна из самых ожидаемых функций. Теперь пользователи приложения могут загружать аудиофайлы для транскрибирования. Бесплатные пользователи могут обрабатывать записи продолжительностью до 10 минут и делать до пяти запросов в день. Владельцы подписок AI Pro и AI Ultra могут загружать аудио до трёх часов. Система поддерживает до 10 файлов в разных форматах, включая архивы ZIP. По словам Джоша Вудворда, вице-президента Google Labs и Gemini, совместимость с аудиофайлами была «запросом № 1» от пользователей приложения.
Кроме того, ИИ-режим «Google Поиска» теперь доступен на пяти новых языках: хинди, индонезийском, японском, корейском и бразильском португальском. Это стало возможным благодаря интеграции Gemini 2.5 с «Поиском». Как отмечается в блоге компании, «с этим расширением больше людей смогут использовать ИИ-режим для ввода сложных вопросов на предпочитаемом языке, глубже исследуя интернет».
Программное обеспечение NotebookLM, также работающее на базе Gemini, получило новые форматы отчетов. Инструмент теперь может генерировать учебные пособия, краткие обзоры, посты для блогов, создавать флеш-карты и викторины на основе загруженных пользователем документов, файлов и других медиа. Функции доступны более чем на 80 языках, а пользователи могут настраивать формат, тон и стиль отчета. Полная доступность обновления ожидается к концу недели.
Эти изменения являются частью серии обновлений ИИ, которые Google внедряет в течение последнего месяца. Ранее Gemini начал автоматически запоминать предпочтения пользователей, а бесплатные пользователи получили доступ к инструменту для генерации видео Vids и функции создания коротких видео из фотографий в Google Photos.