Исследование Apple: ИИ-модели не думают, а лишь имитируют мышление

  • 16.10.2024 17:26
  • 2k+

Исследование, проведенное специалистами Apple, показало, что большие языковые модели (LLM), такие как ChatGPT, не обладают способностью к подлинному логическому мышлению.

В статье, опубликованном в издании TechCrunch, говорится, что такие модели легко сбиваются с толку при добавлении малозначимой информации в задачи, что указывает на имитацию мышления, а не на реальное понимание.
В качестве примера эксперты привели следующую задачу: «Оливер собрал 44 киви в пятницу. Затем он собрал 58 киви в субботу. В воскресенье он собрал вдвое больше киви, чем в пятницу. Сколько киви у Оливера?». Модель решает задачу верно, но добавление несущественной фразы вроде «в воскресенье 5 из этих киви были немного меньше среднего размера», модель скорее всего вычтет эти 5 киви из общего числа, несмотря на то, что размер киви не влияет на их количество.
Один из соавторов исследования Мехрдад Фараджтабар отмечает, что это демонстрирует ограниченность современных моделей в логическом мышлении.

«Они не понимают задачи, а просто воспроизводят шаблоны, наблюдаемые в данных… Мы предполагаем, что это снижение [эффективности] связано с тем фактом, что современные LLM не способны к подлинному логическому рассуждению; вместо этого они пытаются воспроизвести шаги рассуждения, наблюдаемые в их обучающих данных», — поясняет Фараджтабар.

Представители OpenAI утверждают, что правильные результаты можно получить при грамотной формулировке запросов (prompt engineering). Однако, по словам Фараджтабара, сложные задачи требуют значительно большего контекста для исключения отвлекающих факторов.


вчера 16:39
1.6k+

Маяк, метеор и солёный огурец: в iOS 27 появится несколько новых эмодзи

В операционной системе iOS 27 могут появиться девять новых эмодзи. Предварительный список опубликовал консорциум Unicode, который отвечает за стандарты эмодзи и их утверждение для всех платформ. Как правило, Apple добавляет новые эмодзи вместе с весенними обновлениями iOS...

11.01.2026 12:07
518

Браузер Microsot Edge получил новый интерфейс в стиле Copilot

Корпорация Microsoft приступила к тестированию масштабного обновления интерфейса браузера Edge, выполненного в визуальной стилистике ИИ-ассистента Copilot. Изменения затронули дизайн меню, настройки и страницу новой вкладки, которые теперь доступны пользователям на каналах предварительного тестирования Canary и Dev...

05.01.2026 15:06
2k+

Кембридж и Google DeepMind создали тест на «личность» для ИИ

Исследователи из Кембриджского университета и Google DeepMind предложили первый научно обоснованный метод оценки формирования «личности» у больших языковых моделей (LLM).  В основу подхода легли классические психологические тесты, которые подтвердили, что ИИ способен не только имитировать человеческие черты, но и поддаваться точной настройке характера...

03.01.2026 23:42
939

OpenAI формирует единую команду для создания аудиоустройства нового типа

OpenAI расширяет деятельность в сфере аудиомоделей и ведет подготовку к запуску персонального устройства с голосовым интерфейсом. Для реализации проекта сформирована объединенная группа, в которую вошли исследователи, инженеры и продуктовые менеджеры, сообщает издание The Information...