Apple-iň ylmy gözlegi: EA modelleri pikirlenmeýär, olar pikir ýöretmä öýkünýär

  • 16.10.2024 17:26
  • 2k+

Исследование, проведенное специалистами Apple, показало, что большие языковые модели (LLM), такие как ChatGPT, не обладают способностью к подлинному логическому мышлению.

В статье, опубликованном в издании TechCrunch, говорится, что такие модели легко сбиваются с толку при добавлении малозначимой информации в задачи, что указывает на имитацию мышления, а не на реальное понимание.
В качестве примера эксперты привели следующую задачу: «Оливер собрал 44 киви в пятницу. Затем он собрал 58 киви в субботу. В воскресенье он собрал вдвое больше киви, чем в пятницу. Сколько киви у Оливера?». Модель решает задачу верно, но добавление несущественной фразы вроде «в воскресенье 5 из этих киви были немного меньше среднего размера», модель скорее всего вычтет эти 5 киви из общего числа, несмотря на то, что размер киви не влияет на их количество.
Один из соавторов исследования Мехрдад Фараджтабар отмечает, что это демонстрирует ограниченность современных моделей в логическом мышлении.

«Они не понимают задачи, а просто воспроизводят шаблоны, наблюдаемые в данных… Мы предполагаем, что это снижение [эффективности] связано с тем фактом, что современные LLM не способны к подлинному логическому рассуждению; вместо этого они пытаются воспроизвести шаги рассуждения, наблюдаемые в их обучающих данных», — поясняет Фараджтабар.

Представители OpenAI утверждают, что правильные результаты можно получить при грамотной формулировке запросов (prompt engineering). Однако, по словам Фараджтабара, сложные задачи требуют значительно большего контекста для исключения отвлекающих факторов.


şu gün 15:51
284

ChatGPT-niň içinde programmalar dükany peýda boldy

OpenAI kompaniýasy gönüden-göni ChatGPT çat-botunyň interfeýsine girizilen programmalaryň katalogyny hödürledi. Täze çözgüt ulanyjylara çatdan çykmazdan üçünji tarap hyzmatlaryny birikdirmäge, aýdym-sazy dolandyrmaga ýa-da resminamalar bilen işlemäge mümkinçilik berýär diýip, The Verge ýazýar...

düýn 23:03
1.6k+

OpenAI täze ChatGPT Images surat generatoryny işe girizdi

OpenAI kompaniýasy tekst beýany boýunça surat döretmek we redaktirlemek üçin GPT-5.2-niň esasynda täze ChatGPT Images modelini işe girizdi. Esasy maksat jikme-jiklikleri saklap, suratlary mümkin boldugyndan hakyky ýaly etmekden ybarat...

17.12.2025 15:52
2.6k+

«Köpüň biri» serialy Apple TV-de iň meşhur serial boldy

Täze «Köpüň biri» serialy (Pluribus) Apple TV striming platformasynda iň meşhur serial boldy. Taslama tomaşa sany boýunça platformanyň «Bölünişik», «Ted Lasso» we «Säher şüweleňi» ýaly meşhur taslamalaryndan öňe geçdi...

17.12.2025 12:19
4k+

ÝHHG türkmen blogçylary we mazmun döredijileri üçin gysga möhletli okuw geçirdi

ÝHHG-niň Aşgabat merkezinde ýörite ýerli blogçylara we mazmun döredijilere niýetlenen metbugat hem hukuk sowatlylygy boýunça gysga möhletli okuw geçirildi. "Türkmenistan: Altyn asyr" elektron neşiriniň habar bermegine görä, milli alyp baryjylaryň we halkara Gazagystandan bilermen Adil Jalilowyň gatnaşmagynda geçirilen bu çärede jemgyýetçilik pikirini döredýänleri taýýarlamagyň strategik ähmiýeti nygtaldy...