Новое исследование Apple показало: управлять ИИ сложнее, чем кажется

  • 27.01.2026 10:54
  • 1k+

Исследование Apple и Университета Помпеу Фабра показало, что управляемость языковых и генеративных моделей ИИ сильно зависит от задачи, архитектуры модели и формулировки запроса. Авторы пришли к выводу, что предсказуемое поведение ИИ нельзя считать гарантированным.

В экспериментах участвовали модели SmolLM3-3B, Qwen3-4B и Gemma3-4B. Их проверяли на изменении формата и формальности текста, длине строк, а также на генерации четных и нечетных чисел. В простой для человека задаче с числами Gemma3-4B обычно справлялась, тогда как SmolLM3-3B часто допускала ошибки. Qwen3-4B показала полный контроль результата.
При изменении формальности текста Qwen3-4B и Gemma3-4B достигли полного соответствия запросу за пять диалоговых раундов, тогда как SmolLM3-3B осталась плохо управляемой. Исследователи отметили, что даже с обратной связью модели нередко начинают «перекручивать» результат.


Масштабирование Qwen от 0,6 до 14 млрд параметров показало: крупные модели управляются лучше, но заметный прирост снижается после уровня около 4 млрд параметров.
В задачах по генерации изображений по тексту (FLUX-s и SDXL) модели неточно следовали запросам по количеству объектов и насыщенности цвета. Корреляция насыщенности с запросом не превышала 0,1.
Авторы опубликовали инструментарий с открытым исходным кодом и подчеркнули, что управляемость ИИ необходимо проверять экспериментально.
Стоит отметить, что в работе рассматривались модели до 14 млрд параметров, поэтому модели-лидеры, такие как GPT‑5 или Claude 4.5, не тестировались. Авторы считают, что их подход подойдет для любого генератора ИИ, независимо от архитектуры.


вчера 09:50
1k+

Apple раскрыла первые данные о внедрении iOS 26: на нее перешли две трети iPhone

Apple представила первый официальный отчет о распространении операционной системы iOS 26. Данные основаны на активности пользователей в магазине приложений App Store и отражают ситуацию по состоянию на 12 февраля 2026 года...

15.02.2026 21:55
1.4k+

Spotify заявила, что ведущие разработчики перестали писать код вручную

Spotify сообщила, что ведущие разработчики компании «не написали ни одной строчки кода с декабря». По данным платформы, в течение 2025 года в стриминговый сервис внедрили более 50 новых функций и изменений, пишет TechCrunch...

15.02.2026 20:51
6.2k+

Видео с боем Тома Круза и Брэда Питта возмутил голливудские студии

Крупнейшие голливудские студии обвинили китайскую компанию ByteDance в систематическом использовании защищённого авторским правом контента для обучения своих нейросетей. В числе компаний, подавших протесты, оказались Disney и Paramount Skydance, передает Variety...

15.02.2026 17:03
1.6k+

Роман Воннегута о замене людей машинами получит киноадаптацию

По дебютному роману Курта Воннегута «Механическое пианино» снимут художественный фильм. Режиссером картины выступит Рид Морано, сценарий напишет Мэттью Уокер, сообщает Deadline. «Сегодня нет более важной истории для экранизации, чем эта», — отметила Морано...