Исследование Apple: ИИ-модели не думают, а лишь имитируют мышление

  • 16.10.2024 17:26
  • 1.8k+

Исследование, проведенное специалистами Apple, показало, что большие языковые модели (LLM), такие как ChatGPT, не обладают способностью к подлинному логическому мышлению.

В статье, опубликованном в издании TechCrunch, говорится, что такие модели легко сбиваются с толку при добавлении малозначимой информации в задачи, что указывает на имитацию мышления, а не на реальное понимание.
В качестве примера эксперты привели следующую задачу: «Оливер собрал 44 киви в пятницу. Затем он собрал 58 киви в субботу. В воскресенье он собрал вдвое больше киви, чем в пятницу. Сколько киви у Оливера?». Модель решает задачу верно, но добавление несущественной фразы вроде «в воскресенье 5 из этих киви были немного меньше среднего размера», модель скорее всего вычтет эти 5 киви из общего числа, несмотря на то, что размер киви не влияет на их количество.
Один из соавторов исследования Мехрдад Фараджтабар отмечает, что это демонстрирует ограниченность современных моделей в логическом мышлении.

«Они не понимают задачи, а просто воспроизводят шаблоны, наблюдаемые в данных… Мы предполагаем, что это снижение [эффективности] связано с тем фактом, что современные LLM не способны к подлинному логическому рассуждению; вместо этого они пытаются воспроизвести шаги рассуждения, наблюдаемые в их обучающих данных», — поясняет Фараджтабар.

Представители OpenAI утверждают, что правильные результаты можно получить при грамотной формулировке запросов (prompt engineering). Однако, по словам Фараджтабара, сложные задачи требуют значительно большего контекста для исключения отвлекающих факторов.


сегодня 13:15
141

Google интегрирует Gemini для улучшения работы с видео на YouTube и PDF-документами

Google представляет новую функцию Gemini, которая позволит пользователям взаимодействовать с видео на YouTube и PDF-документами в режиме реального времени. Об этом пишет Android Authority. С помощью функции «Talk...

вчера 11:34
467

Microsoft создает отдельное подразделение CoreAI для ускорения работы с ИИ

Microsoft объявила о создании нового инженерного подразделения CoreAI под руководством Джея Париха. Оно будет ориентировано на развитие ИИ-инструментов и приложений, пишет издание The Verge. Генеральный директор...

вчера 11:21
3.7k+

Тестировщик смог впервые взломать iPhone с USB-C

Исследователь безопасности Томас Рот на 38-м конгрессе Chaos Communication заявил, что ему удалось взломать iPhone 15 с USB-C. Материалы мероприятия были опубликованы в январе 2025 года, сообщает издание Appleinsider...

16.01.2025 21:49
2.7k+

Новый ИИ-инструмент от Adobe обрабатывает до 10 000 изображении за один клик

Adobe представила Firefly Bulk Create — инновационный инструмент для автоматизации редактирования изображений. Он позволяет за один клик обрабатывать до 10 000 фотографий одновременно, что значительно ускоряет...