«Последний экзамен человечества»: создан тест, который не пройдёт ни один ИИ

  • 28.01.2025 13:31
  • 6.9k+

Центр безопасности искусственного интеллекта (CAIS) совместно с компанией Scale AI представили тест под названием Humanity’s Last Exam («Последний экзамен человечества»). Он разработан для выявления возможностей современных систем ИИ, пишет TechRadar.

Тест составлен из различных заданий, придуманных более чем 1 000 экспертов из 50 стран мира. Вопросы охватывают широкий спектр дисциплин, включая математику, естественные и гуманитарные науки, а также сложные задачи с графиками и изображениями.
Разработчики стремились оценить способность ИИ решать междисциплинарные задачи, требующие глубокого анализа.
По результатам теста ни одна из продвинутых моделей ИИ не смогла превысить порог точности в 10%. Это подчёркивает, что искусственный интеллект всё ещё далёк от возможности эффективно справляться с многогранными и комплексными задачами, которые требуют глубокого понимания и анализа.
CAIS и Scale AI намерены сделать тест доступным для исследователей. Это позволит использовать бенчмарк для улучшения ИИ и повышения его способности справляться с задачами, требующими высокого уровня знаний и анализа.


вчера 17:05
6.7k+

Градус имеет значение: какая угроза таится в автомобильном кондиционере летом

Летом резкое охлаждение салона автомобиля после длительного пребывания на жаре может негативно сказаться на самочувствии водителя и пассажиров. Специалисты рекомендуют не устанавливать кондиционер на......

05.06.2026 00:08
8.2k+

Цветение саргассовых водорослей в Атлантике стало постоянным и необратимым явлением

Большой Атлантический пояс саргассовых водорослей протяжённостью около 8 тысяч километров от Западной Африки до Карибского бассейна превратился в постоянную экосистему океана. К такому выводу пришли......

04.06.2026 18:42
5.4k+

На острове Хайнань открылся Музей науки, напоминающий облако в вихре

В китайском городе Хайкоу на острове Хайнань завершено строительство Музея науки Хайнаня — культурно-образовательного центра площадью 46 528 квадратных метров. Он расположен на границе Национального......

03.06.2026 19:11
3.3k+

Исследование: Посменная работа уменьшает объем двух областей головного мозга 

Работа по ночам и плавающий график давно признаны серьезным испытанием для организма. Сбои циркадных ритмов, хронический недосып, стресс и повышенный риск сердечно-сосудистых заболеваний — стандартный перечень......