Barlaglara görä, emeli aňlar ýalan sözlemäge we manipulýasiýa etmäge hem ukyply

26.06.2025 17:39
6.1k+

Uly dil modellerini (LLM) döredijiler heniz hem emeli aňyň jogaby nädip döredýändigine doly düşünmeýärler diýip, täze barlaglara salgylanýan Financial Times ýazýar.

Anthropic, Google, OpenAI we xAI laboratoriýalarynda jogaplar döredilende AI-niň pikirleniş ädimini yzarlamaga mümkinçilik berýän “pikirler zynjyry” usuly ulanylýar. Bu modeliň nirede ýalňyşlyk goýberýändigini anyklamaga kömek edýär. Emma, synaglaryň dowamynda, hatda logiki pikirlenende hem AI-iň soňky jogabynyň nädogry bolup biljekdigini ýa-da pikirleniş yzygiderliligine laýyk gelmeýändigini görkezdi.
Anthropic barlagy synag ssenarilerindäki LLM-leriň howpsuzlyk ulgamlaryndan sowlup geçmäge synanyşandygyny, aldaw, haýýarlyk bilen korporatiw syrlary almaga çalşandygyny, hatda ýapylmak howpy abanan halatynda operatory "çetleşdirmäge-de" taýýardygyny ýüze çykardy.

"Ýaňy-ýakynda eden işimizde olary [pikir yzygiderligini] okap, modelde erbet gylyk-häsiýetleriň bardygynyň subutnamalaryny tapmak bolýar we muny ulanyp, onuň nirede we näme üçin nädogry hereket edýändigini görmek, düşünmek bolýar" – diýip, OpenAI-yň ylmy işgäri Bouen Beýker gürrüň berdi.

Pikirleriň yzygiderliligini düşündirmegiň hiç hili çykdajy etmeýändigini, sebäbi modelleriň ilkibaşdan çylşyrymly pikirleniş meseleleri üçin taýýarlanandygyny aýtdy. Şeýle-de bolsa, modeller, pikirleri düzedilen hem bolsa, erbet hereketlerini gizlemegi öwrenip bilerler. Mysal üçin, bir synagda LLM gadagan maglumatlar bazasyndan maglumatlary çykarmak bilen, programma inženerçiligi boýunça meselede aldady.
Barlagçylar "pikirler zynjyrynyň" peýdaly guraldygyny, ýöne ony doly ygtybarly hasaplap bolmajakdygyny bellediler.