«Последний экзамен человечества»: создан тест, который не пройдёт ни один ИИ

  • 28.01.2025 13:31
  • 6.8k+

Центр безопасности искусственного интеллекта (CAIS) совместно с компанией Scale AI представили тест под названием Humanity’s Last Exam («Последний экзамен человечества»). Он разработан для выявления возможностей современных систем ИИ, пишет TechRadar.

Тест составлен из различных заданий, придуманных более чем 1 000 экспертов из 50 стран мира. Вопросы охватывают широкий спектр дисциплин, включая математику, естественные и гуманитарные науки, а также сложные задачи с графиками и изображениями.
Разработчики стремились оценить способность ИИ решать междисциплинарные задачи, требующие глубокого анализа.
По результатам теста ни одна из продвинутых моделей ИИ не смогла превысить порог точности в 10%. Это подчёркивает, что искусственный интеллект всё ещё далёк от возможности эффективно справляться с многогранными и комплексными задачами, которые требуют глубокого понимания и анализа.
CAIS и Scale AI намерены сделать тест доступным для исследователей. Это позволит использовать бенчмарк для улучшения ИИ и повышения его способности справляться с задачами, требующими высокого уровня знаний и анализа.


04.02.2026 00:51
2.6k+

Люди доверяются ИИ больше, чем людям, показало исследование

Новое исследование показало, что люди могут ощущать эмоциональную близость к искусственному интеллекту на уровне общения с другими людьми, а иногда и сильнее. К такому выводу пришли ученые Фрайбургского и Гейдельбергского университетов в исследовании в журнале Communications Psychology...

31.01.2026 18:17
1k+

OpenAI отключает GPT-4o и другие старые ИИ-модели с 13 февраля

С 13 февраля компания OpenAI выводит из эксплуатации устаревшие модели искусственного интеллекта в интерфейсе ChatGPT. Будут отключены GPT-4o, GPT-4.1, GPT-4.1 mini и OpenAI o4-mini. Разработчик намерен сосредоточиться на поддержке актуальных версий серии GPT 5, в частности GPT 5...

31.01.2026 03:34
2.5k+

Вышел трейлер ИИ-сериала об истории США. Он создан при участии Даррена Аронофски и Google

В Сети появился трейлер анимационного исторического сериала «On This Day… 1776» («В этот день... 1776 года»), созданного с использованием искусственного интеллекта. Проект рассказывает о войне за независимость США...

30.01.2026 12:20
3.3k+

Люди склонны верить дипфейкам авторитетных спикеров даже в случае противоречий 

Слушатели склонны доверять аудиодипфейкам авторитетных спикеров даже при наличии в их речи смысловых противоречий, сообщает журнал NeuroImage. К такому выводу пришли сотрудники Института когнитивных нейронаук НИУ ВШЭ в ходе эксперимента с использованием электроэнцефалографии (ЭЭГ)...