«Последний экзамен человечества»: создан тест, который не пройдёт ни один ИИ

  • 28.01.2025 13:31
  • 6.7k+

Центр безопасности искусственного интеллекта (CAIS) совместно с компанией Scale AI представили тест под названием Humanity’s Last Exam («Последний экзамен человечества»). Он разработан для выявления возможностей современных систем ИИ, пишет TechRadar.

Тест составлен из различных заданий, придуманных более чем 1 000 экспертов из 50 стран мира. Вопросы охватывают широкий спектр дисциплин, включая математику, естественные и гуманитарные науки, а также сложные задачи с графиками и изображениями.
Разработчики стремились оценить способность ИИ решать междисциплинарные задачи, требующие глубокого анализа.
По результатам теста ни одна из продвинутых моделей ИИ не смогла превысить порог точности в 10%. Это подчёркивает, что искусственный интеллект всё ещё далёк от возможности эффективно справляться с многогранными и комплексными задачами, которые требуют глубокого понимания и анализа.
CAIS и Scale AI намерены сделать тест доступным для исследователей. Это позволит использовать бенчмарк для улучшения ИИ и повышения его способности справляться с задачами, требующими высокого уровня знаний и анализа.


вчера 13:51
7k+

Популяция клопов выросла 8 тысяч лет назад из-за появления городов

Постельные клопы появились более 100 миллионов лет назад, задолго до появления людей. Они пережили катастрофу, уничтожившую динозавров, и долгое время питались кровью неизвестных животных, пока не начали паразитировать на летучих мышах и ранних людях...

01.06.2025 19:05
3.7k+

В Европе нашли древнейшие орудия из китовой кости: они были в «моде» 20 000 лет назад 

Археологи нашли на берегу Бискайского залива костяные орудия, изготовленные из костей как минимум пяти видов китов. Им около 20 тысяч лет, что делает их самыми древними предметами такого рода, пишет издание New Scientist...

31.05.2025 17:42
7.6k+

Найден самый древний отпечаток пальца: возможно, это произведение искусства

Испанские археологи нашли в пещере Сан-Ласаро камень, напоминающий вытянутое человеческое лицо. Прямо по центру булыжника нанесена красная точка, которая, возможно, изображает нос. Анализ показал, что точку оставили пальцем, обмакнутым в охру, что делает его древнейшим известным отпечатком пальца человека...

28.05.2025 20:26
2.8k+

Жители ОАЭ первыми получат бесплатный доступ к ChatGPT Plus

Жители Объединённых Арабских Эмиратов вскоре первыми в мире получат бесплатный доступ к ChatGPT Plus — платной версии чат-бота от OpenAI. Это часть масштабного партнёрского проекта между OpenAI и властями ОАЭ, пишет издание The Economic Times...