Белый дом и компания Anthropic работают над созданием системы оценки уязвимостей в новых моделях искусственного интеллекта, которая позволит определять уровень рисков и при необходимости принимать меры государственного регулирования.
Переговоры начались после того, как власти США ввели экспортные ограничения в отношении Anthropic. Это произошло из-за обнаруженной в моделях Fable 5 и Mythos 5 уязвимости, позволяющей обходить встроенные ограничения. В результате компания была вынуждена приостановить доступ к этим системам для всех пользователей.
По данным Politico, стороны обсуждают разработку единых критериев оценки подобных инцидентов. Предполагается, что новые стандарты будут учитывать степень обхода защитных механизмов, возможности, которые становятся доступны после взлома, а также потенциальные последствия для экономики и национальной безопасности.
Участники переговоров сходятся во мнении, что полностью защищённых ИИ-моделей не существует, поэтому необходимы чёткие процедуры анализа рисков и определения мер реагирования.
На прошлой неделе разногласия между компанией и администрацией США едва не привели к срыву переговоров. Anthropic не согласилась с оценкой серьёзности выявленной уязвимости, после чего власти ограничили доступ иностранных пользователей к моделям компании. Однако последующие переговоры и серия встреч в Вашингтоне позволили сторонам перейти к обсуждению технических стандартов и механизмов регулирования, что рассматривается как признак прогресса в диалоге.