«Последний экзамен человечества»: создан тест, который не пройдёт ни один ИИ

  • 28.01.2025 13:31
  • 6.4k+

Центр безопасности искусственного интеллекта (CAIS) совместно с компанией Scale AI представили тест под названием Humanity’s Last Exam («Последний экзамен человечества»). Он разработан для выявления возможностей современных систем ИИ, пишет TechRadar.

Тест составлен из различных заданий, придуманных более чем 1 000 экспертов из 50 стран мира. Вопросы охватывают широкий спектр дисциплин, включая математику, естественные и гуманитарные науки, а также сложные задачи с графиками и изображениями.
Разработчики стремились оценить способность ИИ решать междисциплинарные задачи, требующие глубокого анализа.
По результатам теста ни одна из продвинутых моделей ИИ не смогла превысить порог точности в 10%. Это подчёркивает, что искусственный интеллект всё ещё далёк от возможности эффективно справляться с многогранными и комплексными задачами, которые требуют глубокого понимания и анализа.
CAIS и Scale AI намерены сделать тест доступным для исследователей. Это позволит использовать бенчмарк для улучшения ИИ и повышения его способности справляться с задачами, требующими высокого уровня знаний и анализа.


вчера 13:41
1.6k+

DeepSeek за неделю обогнал Gemini и стал вторым по популярности чат-ботом в мире

ИИ-модель от китайской компании DeepSeek стала вторым по популярности чат-ботом в мире, обогнав Google Gemini и Character AI. В течение недели трафик платформы увеличился на 614%, а число пользователей достигло...

04.02.2025 00:28
1.2k+

В Paint появится меню Copilot, где соберутся все имеющиеся в редакторе ИИ-функции

Microsoft решила собрать все ИИ-функции, доступные в графическом редакторе Paint, в одном меню. Специально предназначенная для этого кнопка Copilot появится в новом билде Windows 11 Insider (26120.3073), сообщили в...

03.02.2025 17:39
2.8k+

В Иране откроют первый парк искусственного интеллекта

В Иране в ближайшие два года будет открыт первый национальный парк искусственного интеллекта. Проект на международной конференции в Тегеране анонсировал помощник вице-президента Ирана Моджтаба Алиазаде. По словам...

02.02.2025 21:19
1.9k+

ИИ от Google обзванивает автомастерские и салоны вместо пользователей

Google начала тестирование функции Ask for Me, которая с помощью искусственного интеллекта обзванивает компании от имени пользователей. Новый инструмент помогает уточнять цены, проверять доступность услуг и записываться...