«Последний экзамен человечества»: создан тест, который не пройдёт ни один ИИ

  • 28.01.2025 13:31
  • 6.7k+

Центр безопасности искусственного интеллекта (CAIS) совместно с компанией Scale AI представили тест под названием Humanity’s Last Exam («Последний экзамен человечества»). Он разработан для выявления возможностей современных систем ИИ, пишет TechRadar.

Тест составлен из различных заданий, придуманных более чем 1 000 экспертов из 50 стран мира. Вопросы охватывают широкий спектр дисциплин, включая математику, естественные и гуманитарные науки, а также сложные задачи с графиками и изображениями.
Разработчики стремились оценить способность ИИ решать междисциплинарные задачи, требующие глубокого анализа.
По результатам теста ни одна из продвинутых моделей ИИ не смогла превысить порог точности в 10%. Это подчёркивает, что искусственный интеллект всё ещё далёк от возможности эффективно справляться с многогранными и комплексными задачами, которые требуют глубокого понимания и анализа.
CAIS и Scale AI намерены сделать тест доступным для исследователей. Это позволит использовать бенчмарк для улучшения ИИ и повышения его способности справляться с задачами, требующими высокого уровня знаний и анализа.


вчера 23:30
421

xAI Илона Маска анонсировала Grok Code Fast 1 – ИИ для программистов

Компания Илона Маска xAI представила Grok Code Fast 1 — модель искусственного интеллекта для программирования, ориентированную на скорость и практичность. Модель создана на новой архитектуре и обучена на большом массиве данных с готовыми решениями...

вчера 12:23
1.5k+

OpenAI проверяет переписки с ChatGPT и передает опасный контент в полицию

Компания OpenAI в своем блоге рассказала о том, что переписка пользователей ChatGPT теперь анализируется на наличие вредоносного контента. Потенциально опасные сообщения передаются сотрудникам для проверки, а в отдельных случаях могут быть направлены в полицию...

02.09.2025 19:21
3.3k+

Британский композитор создала музыку, которая делает шоколад слаще и сливочнее

В Великобритании разработали мелодию, при прослушивании которой шоколад кажется вкуснее, сообщает New York Post. Композитор и эксперт по звуку из Бристольского университета Натали Хиацинт изучала исследования о влиянии музыки на вкусовые ощущения за последние 60 лет...

31.08.2025 20:37
3k+

Исследователи обнаружили первый компьютерный вирус, работающий с ИИ

Специалисты ESET Research Labs обнаружили вредоносную программу PromptLock, работающую с помощью искусственного интеллекта. Это первый известный вирус такого типа. Программа-вымогатель отправляет фиксированные промпты в локальную ИИ-модель и в ответ генерирует Lua-скрипты (язык программирования, созданный в 1993 году, он часто используется при создании игр)...