Google представила новую модель искусственного интеллекта Gemini 2.0, которая отличается повышенной производительностью, скоростью и эффективностью, сообщает The Verge.
ИИ-модель не только сохранила все преимущества предшественника, но также демонстрирует новые возможности: встроенную генерацию аудио и изображений, а также мультимодальные функции, которые, по мнению разработчиков, станут основой для создания интеллектуальных агентов.
Gemini 2.0 появилась спустя 10 месяцев после дебюта версии 1.5 и доступна в экспериментальном режиме, также есть облегченная версия 2.0 Flash.
Генеральный директор Google DeepMind Демис Хассабис считает, что разработка заложит основу для массового внедрения ИИ-агентов, которые будут самостоятельно выполнять различные задачи по поручению человека.
Например, расширятся возможности проекта Astra, — визуальной системы, которая помогает ориентироваться в пространстве, искать предметы и выполнять другие задачи, связанные с восприятием окружающего мира. Кроме того, Google анонсировала экспериментальное расширение для браузера Chrome — Project Mariner. Оно поможет автоматизировать многие веб-задачи. Еще один пример — агент Jules, созданный для помощи программистам в поиске и исправлении ошибок в коде.
Модель будет интегрирована и в ключевые сервисы компании, включая поиск и платформу Workspace. Например, в Google Search она улучшит функцию AI Overviews, которой уже пользуется более миллиарда человек.
Вместо того, чтобы запускать несколько отдельных и разрозненных продуктов, Google сосредоточена на том, чтобы сделать модель универсальной.
Однако в плане безопасности массовое использование ИИ-агентов вызывает у экспертов озабоченность. Хассабис подчеркивает необходимость дополнительных исследований, например, тестирования в изолированных средах.
Gemini 2.0 уже можно опробовать в веб-приложении Gemini. В начале следующего года модель планируется интегрировать в другие продукты Google и сделать доступной по всему интернету.