Чат-бот o4-mini от OpenAI бросил вызов ведущим математикам Беркли

  • 14.06.2025 12:35
  • 4.1k+

В Беркли, Калифорния, прошло закрытое двухдневное мероприятие, организованное Epoch AI. На нем 30 ведущих математиков мира соревновались с чат-ботом o4-mini от OpenAI. Целью было испытать способности нейросети к сложным логическим рассуждениям.

Ученым запретили обсуждать событие, чтобы обеспечить чистоту эксперимента, сообщило издание Scientific American спустя три недели.
Математики подготовили 300 уникальных задач разной сложности, от студенческих до исследовательских. o4-mini, представленная в июле 2024 года как экономичная модель, решила около 20% задач уже в ходе подготовки. На встрече ученые предложили десять особо сложных вопросов. За каждую задачу, которую ИИ не смог бы решить, автору полагалось вознаграждение $7500.
Чат-бот поразил участников. Например, он успешно справился с задачей из теории чисел уровня докторской диссертации. Как отметил руководитель проекта, судья, и математик Кен Оно, нейросеть изучала литературу, упрощала задачу и предлагала верное решение в реальном времени.

«Я никогда раньше не видел такого рода рассуждений в моделях. Это то, что делает ученый-математик. Это пугает», — сказал он.

Хотя ученые нашли десять задач, которые поставили o4-mini в тупик, они были впечатлены прогрессом ИИ. Нейросеть решала задачи за минуты, тогда как человеку для этого потребовались бы недели или месяцы. Участники признали, что в некоторых аспектах o4-mini превосходит лучших аспирантов мира.


вчера 16:15
4k+

Билл Гейтс предупредил о рисках стремительного развития ИИ

Билл Гейтс опубликовал ежегодное эссе «Оптимизм со сносками». На этот раз сооснователь Microsoft изложил свою оценку текущего состояния и перспектив развития искусственного интеллекта.  Наряду с признанием высокого потенциала технологии он обратил внимание на системные риски, связанные с ее молниеносным и недостаточно регулируемым внедрением...

11.01.2026 12:07
565

Браузер Microsot Edge получил новый интерфейс в стиле Copilot

Корпорация Microsoft приступила к тестированию масштабного обновления интерфейса браузера Edge, выполненного в визуальной стилистике ИИ-ассистента Copilot. Изменения затронули дизайн меню, настройки и страницу новой вкладки, которые теперь доступны пользователям на каналах предварительного тестирования Canary и Dev...

05.01.2026 15:06
2k+

Кембридж и Google DeepMind создали тест на «личность» для ИИ

Исследователи из Кембриджского университета и Google DeepMind предложили первый научно обоснованный метод оценки формирования «личности» у больших языковых моделей (LLM).  В основу подхода легли классические психологические тесты, которые подтвердили, что ИИ способен не только имитировать человеческие черты, но и поддаваться точной настройке характера...

03.01.2026 23:42
943

OpenAI формирует единую команду для создания аудиоустройства нового типа

OpenAI расширяет деятельность в сфере аудиомоделей и ведет подготовку к запуску персонального устройства с голосовым интерфейсом. Для реализации проекта сформирована объединенная группа, в которую вошли исследователи, инженеры и продуктовые менеджеры, сообщает издание The Information...