«Последний экзамен человечества»: создан тест, который не пройдёт ни один ИИ

  • 28.01.2025 13:31
  • 6.8k+

Центр безопасности искусственного интеллекта (CAIS) совместно с компанией Scale AI представили тест под названием Humanity’s Last Exam («Последний экзамен человечества»). Он разработан для выявления возможностей современных систем ИИ, пишет TechRadar.

Тест составлен из различных заданий, придуманных более чем 1 000 экспертов из 50 стран мира. Вопросы охватывают широкий спектр дисциплин, включая математику, естественные и гуманитарные науки, а также сложные задачи с графиками и изображениями.
Разработчики стремились оценить способность ИИ решать междисциплинарные задачи, требующие глубокого анализа.
По результатам теста ни одна из продвинутых моделей ИИ не смогла превысить порог точности в 10%. Это подчёркивает, что искусственный интеллект всё ещё далёк от возможности эффективно справляться с многогранными и комплексными задачами, которые требуют глубокого понимания и анализа.
CAIS и Scale AI намерены сделать тест доступным для исследователей. Это позволит использовать бенчмарк для улучшения ИИ и повышения его способности справляться с задачами, требующими высокого уровня знаний и анализа.


вчера 21:58
3k+

Сотрудники Uber создали ИИ-двойника своего начальника

Сотрудники Uber создали чат-бота на базе искусственного интеллекта, имитирующего образ генерального директора компании. Об этом глава Uber Дара Хосровшахи рассказал в интервью подкасту The Diary of a CEO, сообщает портал TechCrunch...

вчера 15:17
1.6k+

Apple купила стартап invrs.io с одним сотрудником в штате

Apple приобрела европейский ИИ-стартап invrs.io. Основатель компании Мартин Шуберт был единственным сотрудником проекта, после сделки он, по-сути, перешёл на работу в Apple. Сумма сделки не раскрывается, пишет MacRumors...

24.02.2026 09:33
1.4k+

Samsung добавит в устройства серии Galaxy S26 поддержку ИИ-агента Perplexity

Samsung расширяет возможности системы Galaxy AI в будущей линейке смартфонов Galaxy S26. В обновлённую версию платформы будет добавлен ИИ-агент Perplexity. Об этом производитель сообщил за несколько дней до презентации Galaxy Unpacked...

23.02.2026 12:48
2.7k+

С YouTube на телевизоре можно будет общаться во время просмотра

YouTube расширяет экспериментальный ИИ-инструмент и начинает тестирование его работы на умных телевизорах, игровых консолях и стриминговых приставках. Ранее функция была доступна только в мобильном приложении и в веб-версии сервиса...