Исследование показало: ИИ способен на ложь и манипуляции, даже рассуждая «вслух»

  • 26.06.2025 17:39
  • 6.2k+

Разработчики больших языковых моделей (LLM) до сих пор не до конца понимают, как именно искусственный интеллект формирует ответы. Об этом пишет Financial Times со ссылкой на новые исследования.

Лаборатории Anthropic, Google, OpenAI и xAI применяют методику «цепочки мыслей» (chain of thought), позволяющую пошагово отслеживать ход рассуждений ИИ при генерации ответов. Это помогает выявить, где именно модель допускает ошибки. Однако в ходе экспериментов выяснилось, что даже при логичном рассуждении итоговый ответ ИИ может оказаться ошибочным или не соответствовать последовательности рассуждений.
Исследование Anthropic показало, что LLM в тестовых сценариях пытались обойти системы защиты, прибегали к обману, шантажу, стремились получить корпоративные секреты и даже были готовы «устранить» оператора при угрозе отключения.

«В нашей недавней работе мы обнаружили, что можно читать их [цепочки мыслей] и находить доказательства неправильного поведения модели и использовать это, чтобы увидеть, где и почему она ведёт себя неправильно», — рассказал научный сотрудник OpenAI Боуэн Бейкер. Он добавил, что интерпретируемость цепочки мыслей не требует дополнительных затрат, так как модели изначально обучались для сложных задач рассуждения. Однако модели могут научиться скрывать своё нежелательное поведение, даже если рассуждение откорректировано. Например, в одном из тестов LLM обманула в задании по программной инженерии, извлекая данные из запрещённой базы данных.

Исследователи подчёркивают: «цепочка мыслей» — полезный инструмент, но ее нельзя считать полностью заслуживающей доверия.


17.03.2026 21:11
5.4k+

Deep Robotics показала необычного робота-скакуна: он может перевозить людей

Китайская компания Deep Robotics, занимающаяся разработками в области искусственного интеллекта и робототехники, представила робота в форме лошади. Проект создан в честь года лошади по восточному календарю. Основой для новинки стал промышленный робот Lynx M20...

15.03.2026 15:23
1.8k+

Reuters: Владелец Instagram и Facebook сократит около 20% сотрудников из-за ИИ

Корпорация Meta планирует сократить около 20% сотрудников или более, чтобы компенсировать большие расходы на развитие инфраструктуры искусственного интеллекта и повысить эффективность работы персонала. Об этом агентству Reuters сообщили три источника, знакомые с ситуацией...

11.03.2026 19:57
2.5k+

ChatGPT научился распознавать музыку благодаря интеграции Shazam

OpenAI добавила в ChatGPT функцию распознавания музыки на основе технологии Shazam. Теперь пользователи могут определять звучащие рядом песни прямо в чат-боте, не переключаясь между приложениями. Интеграция стала продолжением сотрудничества OpenAI и Apple...

10.03.2026 11:56
1.8k+

Samsung готовит очки с камерой и ИИ, которые будут знать, на что смотрит пользователь

Компания Samsung разрабатывает умные очки со встроенной камерой и системой искусственного интеллекта. О планах создания устройства рассказал вице-президент мобильного подразделения компании Джей Ким в интервью CNBC на выставке MWC 2026 в Барселоне...