Чат-бот Gemini научился расшифровывать аудиозаписи и расширил функционал

  • 12.09.2025 17:47
  • 1.5k+

Компания Google представила три значительных обновления для своих продуктов на базе искусственного интеллекта Gemini.

Главным нововведением стала возможность чат-бота Gemini расшифровывать аудиозаписи — одна из самых ожидаемых функций. Теперь пользователи приложения могут загружать аудиофайлы для транскрибирования. Бесплатные пользователи могут обрабатывать записи продолжительностью до 10 минут и делать до пяти запросов в день. Владельцы подписок AI Pro и AI Ultra могут загружать аудио до трёх часов. Система поддерживает до 10 файлов в разных форматах, включая архивы ZIP. По словам Джоша Вудворда, вице-президента Google Labs и Gemini, совместимость с аудиофайлами была «запросом № 1» от пользователей приложения.
Кроме того, ИИ-режим «Google Поиска» теперь доступен на пяти новых языках: хинди, индонезийском, японском, корейском и бразильском португальском. Это стало возможным благодаря интеграции Gemini 2.5 с «Поиском». Как отмечается в блоге компании, «с этим расширением больше людей смогут использовать ИИ-режим для ввода сложных вопросов на предпочитаемом языке, глубже исследуя интернет».
Программное обеспечение NotebookLM, также работающее на базе Gemini, получило новые форматы отчетов. Инструмент теперь может генерировать учебные пособия, краткие обзоры, посты для блогов, создавать флеш-карты и викторины на основе загруженных пользователем документов, файлов и других медиа. Функции доступны более чем на 80 языках, а пользователи могут настраивать формат, тон и стиль отчета. Полная доступность обновления ожидается к концу недели.
Эти изменения являются частью серии обновлений ИИ, которые Google внедряет в течение последнего месяца. Ранее Gemini начал автоматически запоминать предпочтения пользователей, а бесплатные пользователи получили доступ к инструменту для генерации видео Vids и функции создания коротких видео из фотографий в Google Photos.


22.12.2025 15:14
2.3k+

Gemini научился распознавать ИИ-контент от Google

Google добавила в свой чат-бот Gemini функцию распознавания контента, созданного ИИ-моделями компании. Для этого используется специальная цифровая метка. Пользователь может отправить в Gemini изображение или видеоролик и спросить, были ли они сгенерированы искусственным интеллектом...

19.12.2025 15:51
2k+

Все, чтобы ты не покидал диалог: в ChatGPT интегрировали сторонние приложения

Компания OpenAI представила каталог приложений, интегрированный непосредственно в интерфейс чат-бота ChatGPT. Новое решение позволяет пользователям подключать сторонние сервисы, управлять медиабиблиотеками или работать с документами, не покидая чат, пишет The Verge...

18.12.2025 23:03
2.3k+

OpenAI запустила новый генератор изображений ChatGPT Images

Компания OpenAI запустила ChatGPT Images — новую модель на базе GPT-5.2 для создания и редактирования изображения по текстовым описаниям. Главная цель разработки — сохранять детали и делать картинки максимально реалистичными...

17.12.2025 12:19
4.3k+

ОБСЕ провела для туркменских блогеров курс по фактчекингу

В Центре ОБСЕ в Ашхабаде состоялся обучающий курс по медийной и правовой грамотности, ориентированный на местных блогеров и создателей контента. Целью мероприятия стало повышение «цифрового иммунитета» общества и минимизация рисков, связанных с распространением недостоверной информации, сообщает издание «Золотой век»...