Чат-бот o4-mini от OpenAI бросил вызов ведущим математикам Беркли

  • 14.06.2025 12:35
  • 4k+

В Беркли, Калифорния, прошло закрытое двухдневное мероприятие, организованное Epoch AI. На нем 30 ведущих математиков мира соревновались с чат-ботом o4-mini от OpenAI. Целью было испытать способности нейросети к сложным логическим рассуждениям.

Ученым запретили обсуждать событие, чтобы обеспечить чистоту эксперимента, сообщило издание Scientific American спустя три недели.
Математики подготовили 300 уникальных задач разной сложности, от студенческих до исследовательских. o4-mini, представленная в июле 2024 года как экономичная модель, решила около 20% задач уже в ходе подготовки. На встрече ученые предложили десять особо сложных вопросов. За каждую задачу, которую ИИ не смог бы решить, автору полагалось вознаграждение $7500.
Чат-бот поразил участников. Например, он успешно справился с задачей из теории чисел уровня докторской диссертации. Как отметил руководитель проекта, судья, и математик Кен Оно, нейросеть изучала литературу, упрощала задачу и предлагала верное решение в реальном времени.

«Я никогда раньше не видел такого рода рассуждений в моделях. Это то, что делает ученый-математик. Это пугает», — сказал он.

Хотя ученые нашли десять задач, которые поставили o4-mini в тупик, они были впечатлены прогрессом ИИ. Нейросеть решала задачи за минуты, тогда как человеку для этого потребовались бы недели или месяцы. Участники признали, что в некоторых аспектах o4-mini превосходит лучших аспирантов мира.


вчера 18:42
706

Netflix патентует технологию создания кино и трейлеров под каждого зрителя на базе ИИ

Netflix работает над созданием персонализированных трейлеров и интерактивных фильмов с использованием технологий искусственного интеллекта. Об этом свидетельствуют новые патенты компании, с которыми ознакомился Business Insider...

03.07.2025 14:56
2.5k+

Эксперты сравнили и выбрали лучшего ИИ для смартфона

На YouTube-канале Mrwhosetheboss сравнили популярные ИИ-чат-боты для смартфонов: ChatGPT, Google Gemini (2.5 Pro), Perplexity Pro и Grok 3. Целью теста было определить, какой из них работает эффективнее в разных сценариях...

02.07.2025 14:07
4.8k+

В Южной Корее вышел мультсериал, созданием которого на всех стадиях занимался ИИ

Компания CJ ENM, выпустившая фильм «Паразиты», представила мультсериал «Кот Бигги», полностью созданный искусственным интеллектом. Разработчики заявляют, что ИИ занимался всем процессом — от создания концепции до дистрибуции и продвижения...

02.07.2025 11:13
2.3k+

Google запустила приложение Doppl для примерки одежды по фотографии

Google запустила экспериментальное приложение Doppl, предназначенное для виртуальной примерки одежды с помощью искусственного интеллекта. Сейчас оно доступно только в США на устройствах iOS и Android, сообщает TechCrunch...