Чат-бот o4-mini от OpenAI бросил вызов ведущим математикам Беркли

  • 14.06.2025 12:35
  • 4k+

В Беркли, Калифорния, прошло закрытое двухдневное мероприятие, организованное Epoch AI. На нем 30 ведущих математиков мира соревновались с чат-ботом o4-mini от OpenAI. Целью было испытать способности нейросети к сложным логическим рассуждениям.

Ученым запретили обсуждать событие, чтобы обеспечить чистоту эксперимента, сообщило издание Scientific American спустя три недели.
Математики подготовили 300 уникальных задач разной сложности, от студенческих до исследовательских. o4-mini, представленная в июле 2024 года как экономичная модель, решила около 20% задач уже в ходе подготовки. На встрече ученые предложили десять особо сложных вопросов. За каждую задачу, которую ИИ не смог бы решить, автору полагалось вознаграждение $7500.
Чат-бот поразил участников. Например, он успешно справился с задачей из теории чисел уровня докторской диссертации. Как отметил руководитель проекта, судья, и математик Кен Оно, нейросеть изучала литературу, упрощала задачу и предлагала верное решение в реальном времени.

«Я никогда раньше не видел такого рода рассуждений в моделях. Это то, что делает ученый-математик. Это пугает», — сказал он.

Хотя ученые нашли десять задач, которые поставили o4-mini в тупик, они были впечатлены прогрессом ИИ. Нейросеть решала задачи за минуты, тогда как человеку для этого потребовались бы недели или месяцы. Участники признали, что в некоторых аспектах o4-mini превосходит лучших аспирантов мира.


16.08.2025 17:45
1.6k+

YouTube тестирует систему проверки возраста зрителей по видео, которые они смотрят

13 августа YouTube начал в США тестирование новой системы верификации возраста пользователей. Технология использует искусственный интеллект, чтобы различать взрослых или несовершеннолетних зрителей по характеру просматриваемых ими видео...

13.08.2025 07:32
1.6k+

Модель o3 от OpenAI с разгромом обыграла Grok Илона Маска в шахматном противостоянии

ИИ-модель o3 от OpenAI выиграла у Grok 4, созданной компанией xAI Илона Маска, со счётом 4:0 в финальном поединке шахматного турнира Kaggle AI Exhibition. Об этом сообщает The Independent. В соревновании также участвовали ИИ-модели от Anthropic, DeepSeek, Google и Moonshot AI...

13.08.2025 07:28
2.2k+

Новая Genie 3 от Google создает виртуальные миры, запоминая окружение

Компания Google представила новую версию своей модели искусственного интеллекта Genie 3. Нейросеть способна создавать реалистичное видео с разрешением 720p по запросу пользователя. В отличие от предыдущих версий, ИИ научилась запоминать окружающий мир, даже когда пользователь отворачивается...

12.08.2025 14:15
1.6k+

В работе нейросети DeepSeek произошел глобальный сбой

Вечером 11 августа пользователи нейросети DeepSeek сообщили о масштабном сбое в работе китайского сервиса. Проблемы затронули как веб-версию, так и мобильное приложение. В уведомлении на сайте чат-бота подтвердили наличие проблемы...