Gemini 3 Deep Think превзошла средний результат человека в тесте на абстрактное мышление

  • 14.02.2026 16:02
  • 2.2k+

Google DeepMind представила крупное обновление режима Gemini 3 Deep Think, ориентированного на научные и инженерные задачи. Ключевой показатель новой версии — достижение 84,6% на бенчмарке ARC-AGI-2, который проверяет способность решать новые абстрактные задачи без опоры на обучающую выборку.

В декабре предыдущая версия набирала в этом тесте 45,1%. Для сравнения, средний результат обычного человека составляет 60%.
Ближайшие конкуренты показали более низкие значения: Claude Opus 4.6 — 68,8%, GPT-5.2 Thinking — 52,9%. Помимо этого, обновлённая модель достигла уровня золотой медали на письменных этапах Международных олимпиад по физике и химии 2025 года. На платформе Codeforces Deep Think получила рейтинг Elo 3455 — заметно выше показателей Gemini 3 Pro и Claude Opus 4.6.
В академическом тесте Humanity’s Last Exam модель набрала 48,4% без использования инструментов, опередив конкурентов.
Google также привела примеры практического применения модели — от проверки научных статей до оптимизации синтеза полупроводниковых материалов в университетских лабораториях.
Deep Think уже доступна подписчикам Google AI Ultra и впервые открыта через Gemini API в рамках раннего доступа. Создатели ARC Prize подчёркивают, что высокий результат на бенчмарке отражает пока только прогресс в достижении AGI. Авторы уже готовят бенчмарк ARC-AGI-3 с более сложными задачами.


22.03.2026 04:00
2.9k+

Pixel 10 Pro XL уступил Galaxy S26 по времени работы батареи, хотя у Pixel она больше на 1000 мАч

Смартфон Pixel 10 Pro XL проиграл по автономности Samsung Galaxy S26, хотя его батарея на 1000 мА·ч больше. Согласно тестам ресурса GSMArena, Galaxy S26 проработал в активном режиме около 15 часов 20 минут, а Pixel 10 Pro XL — 12 часов 29 минут...

17.03.2026 10:29
877

В Google Maps появился режим трёхмерной навигации и чат-бот Gemini

Компания Google представила крупнейшее обновление автомобильной навигации в приложении Google Maps за последние десять лет. Новый режим Immersive Navigation заменяет привычную плоскую карту трёхмерным отображением окружающего пространства...

07.03.2026 17:10
914

OpenAI представила GPT-5.4. В нем контекстное окно увеличили до миллиона токенов

OpenAI представила новую языковую модель GPT-5.4. Разработчики продолжают развивать линейку систем искусственного интеллекта, уделяя больше внимания решению сложных задач, программированию и работе с различными инструментами...

06.03.2026 12:05
2.7k+

В GPT-5.4 появится режим экстремального рассуждения

В модели GPT-5.4 может появиться специальный режим обработки сложных запросов. Об этом сообщает издание The Information. По данным источника, в таком режиме модель будет использовать больше времени и вычислительных ресурсов для решения задач, требующих сложной логики и детального анализа...