Исследование Apple: ИИ-модели не думают, а лишь имитируют мышление

  • 16.10.2024 17:26
  • 2k+

Исследование, проведенное специалистами Apple, показало, что большие языковые модели (LLM), такие как ChatGPT, не обладают способностью к подлинному логическому мышлению.

В статье, опубликованном в издании TechCrunch, говорится, что такие модели легко сбиваются с толку при добавлении малозначимой информации в задачи, что указывает на имитацию мышления, а не на реальное понимание.
В качестве примера эксперты привели следующую задачу: «Оливер собрал 44 киви в пятницу. Затем он собрал 58 киви в субботу. В воскресенье он собрал вдвое больше киви, чем в пятницу. Сколько киви у Оливера?». Модель решает задачу верно, но добавление несущественной фразы вроде «в воскресенье 5 из этих киви были немного меньше среднего размера», модель скорее всего вычтет эти 5 киви из общего числа, несмотря на то, что размер киви не влияет на их количество.
Один из соавторов исследования Мехрдад Фараджтабар отмечает, что это демонстрирует ограниченность современных моделей в логическом мышлении.

«Они не понимают задачи, а просто воспроизводят шаблоны, наблюдаемые в данных… Мы предполагаем, что это снижение [эффективности] связано с тем фактом, что современные LLM не способны к подлинному логическому рассуждению; вместо этого они пытаются воспроизвести шаги рассуждения, наблюдаемые в их обучающих данных», — поясняет Фараджтабар.

Представители OpenAI утверждают, что правильные результаты можно получить при грамотной формулировке запросов (prompt engineering). Однако, по словам Фараджтабара, сложные задачи требуют значительно большего контекста для исключения отвлекающих факторов.


вчера 20:08
1.6k+

В бесплатной версии ChatGPT начнут размещать рекламу

OpenAI ближайшее время начнет в тестовом режиме размещать рекламу в ChatGPT. Она будет появляться рядом с ответами на запросы в базовой бесплатной версии и версии Go. Пока речь идет только о пользователях в США...

вчера 15:59
1k+

OpenAI запустила бесплатный ИИ-переводчик ChatGPT Translate

Компания OpenAI запустила новый сервис ChatGPT Translate. Сейчас ИИ-переводчик работает в режиме бета-тестирования, работает бесплатно и поддерживает более 50 языков, в том числе русский. Как отмечает издание Android Authority, официально компания еще не анонсировала продукт, однако сервис уже доступен пользователям на отдельном сайте...

вчера 15:41
7.1k+

Список самых неудачных смартфонов в истории

Эксперты портала BGR составили список смартфонов, которые запомнились пользователям надолго, но не благодаря своим заслугам, а из-за опасностей, технических просчетов или неудачных концепций. В перечень худших вошли 13 моделей...

17.01.2026 15:03
4.8k+

Билл Гейтс предсказал двухдневную рабочую неделю через десять лет

Соучредитель Microsoft Билл Гейтс заявил, что через десять лет люди будут работать всего два дня в неделю благодаря развитию искусственного интеллекта. Об этом он рассказал в интервью The Tonight Show с Джимми Фэллоном, объяснив, что многие задачи перестанут требовать участия человека, высвобождая массу времени для других дел...