«Последний экзамен человечества»: создан тест, который не пройдёт ни один ИИ

  • 28.01.2025 13:31
  • 6.7k+

Центр безопасности искусственного интеллекта (CAIS) совместно с компанией Scale AI представили тест под названием Humanity’s Last Exam («Последний экзамен человечества»). Он разработан для выявления возможностей современных систем ИИ, пишет TechRadar.

Тест составлен из различных заданий, придуманных более чем 1 000 экспертов из 50 стран мира. Вопросы охватывают широкий спектр дисциплин, включая математику, естественные и гуманитарные науки, а также сложные задачи с графиками и изображениями.
Разработчики стремились оценить способность ИИ решать междисциплинарные задачи, требующие глубокого анализа.
По результатам теста ни одна из продвинутых моделей ИИ не смогла превысить порог точности в 10%. Это подчёркивает, что искусственный интеллект всё ещё далёк от возможности эффективно справляться с многогранными и комплексными задачами, которые требуют глубокого понимания и анализа.
CAIS и Scale AI намерены сделать тест доступным для исследователей. Это позволит использовать бенчмарк для улучшения ИИ и повышения его способности справляться с задачами, требующими высокого уровня знаний и анализа.


вчера 23:56
598

У Apple есть секретное приложение Veritas для iPhone. Это аналог ChatGPT

Apple разрабатывает новое приложение Veritas для тестирования обновлённой версии голосового ассистента Siri. Как сообщает журналист Bloomberg Марк Гурман, программа пока держится под секретом и используется только внутри компании...

27.09.2025 19:28
7.8k+

В Аргентине нашли останки прежде неизвестного хищного мегараптора и его жертвы

На юге Аргентины палеонтологи обнаружили останки ранее неизвестного хищного динозавра с мощными передними лапами и длинными когтями. Это открытие подтверждает длительное существование ящеров рода мегарапторов на территории Южной Америки, говорится в статье в Nature Communications...

26.09.2025 21:15
5.4k+

Magnum будет создавать новое мороженое с помощью ИИ от NotCo

Производитель мороженого Magnum, входящий в группу компании Unilever и готовящийся в ноябре выйти на биржу, объявил о планах использовать в своей работе искусственный интеллект чилийского стартапа NotCo. Новая технология поможет менять рецептуры и разрабатывать свежие продукты...

24.09.2025 13:13
3.3k+

OpenAI поделилась подробностями о самых частых запросах к ChatGPT

Группа исследователей OpenAI проанализировала 1,5 миллиона запросов пользователей к ChatGPT и составила список самых частых причин, по которым люди обращаются к чат-боту. Это первое масштабное исследование, которое показывает, как люди реально используют этот инструмент, сообщает The Independent...