Gemini 3 Deep Think превзошла средний результат человека в тесте на абстрактное мышление

  • сегодня 16:02
  • 427

Google DeepMind представила крупное обновление режима Gemini 3 Deep Think, ориентированного на научные и инженерные задачи. Ключевой показатель новой версии — достижение 84,6% на бенчмарке ARC-AGI-2, который проверяет способность решать новые абстрактные задачи без опоры на обучающую выборку.

В декабре предыдущая версия набирала в этом тесте 45,1%. Для сравнения, средний результат обычного человека составляет 60%.
Ближайшие конкуренты показали более низкие значения: Claude Opus 4.6 — 68,8%, GPT-5.2 Thinking — 52,9%. Помимо этого, обновлённая модель достигла уровня золотой медали на письменных этапах Международных олимпиад по физике и химии 2025 года. На платформе Codeforces Deep Think получила рейтинг Elo 3455 — заметно выше показателей Gemini 3 Pro и Claude Opus 4.6.
В академическом тесте Humanity’s Last Exam модель набрала 48,4% без использования инструментов, опередив конкурентов.
Google также привела примеры практического применения модели — от проверки научных статей до оптимизации синтеза полупроводниковых материалов в университетских лабораториях.
Deep Think уже доступна подписчикам Google AI Ultra и впервые открыта через Gemini API в рамках раннего доступа. Создатели ARC Prize подчёркивают, что высокий результат на бенчмарке отражает пока только прогресс в достижении AGI. Авторы уже готовят бенчмарк ARC-AGI-3 с более сложными задачами.


сегодня 10:34
1k+

Камень был полем противостояния: ИИ раскрыл правила забытой древнеримской игры

Ученые с помощью искусственного интеллекта смогли реконструировать правила настольной игры, вырезанной на камне, найденном в голландском Херлене. Исследования показали, что в эту игру играли на несколько веков раньше, чем считалось...

07.02.2026 00:23
5.2k+

ИИ не хватает обычных рук: рост нейросетей привел к дефициту электриков

Быстрый рост индустрии искусственного интеллекта выявил острую нехватку специалистов рабочих профессий, необходимых для строительства и обслуживания дата центров, пишет WIRED. Резко вырос спрос на электриков, строителей, специалистов по вентиляции и охлаждению...

01.02.2026 11:42
1.8k+

Google DeepMind создала инструмент, предсказывающий наследственные заболевания

Компания Google DeepMind представила ИИ-инструмент AlphaGenome, предназначенный для выявления генетических факторов возникновения заболеваний. Модель способна единовременно анализировать до 1 млн знаков ДНК-кода, что поможет при разработке новых терапевтических методов, сообщает The Guardian...

01.02.2026 10:54
991

YouTube начала чистку ИИ-контента

YouTube начал удалять низкокачественный контент, созданный с использованием искусственного интеллекта. Из-за этого с платформы уже исчезли два крупных канала, сообщает The Verge. По данным отчёта сервиса для видеомонтажа Kapwing, был удалён канал CuentosFacianantes с аудиторией 5,9 млн подписчиков...