Пять крупных издательств (Hachette, Macmillan, McGraw Hill, Elsevier и Cengage), а также писатель Скотт Туроу подали против Meta коллективный иск в Окружной суд США по Южному округу Нью-Йорка.
Истцы обвиняют руководство компании и лично её гендиректора Марка Цукерберга в преднамеренном и массовом нарушении авторских прав при сборе данных для обучения языковой модели Llama. Сторона обвинения утверждает, что Цукерберг лично санкционировал использование пиратских ресурсов.
Согласно материалам дела, Meta скачивала миллионы защищенных произведений через торренты и несанкционированный веб-скрейпинг, включая данные из хранилища LibGen, которое во внутренних документах компании называлось «набором данных, заведомо полученным путем пиратства». Утверждается, что Цукерберг распорядился прекратить переговоры о лицензировании контента (на которые планировалось выделить до $200 млн), чтобы не создавать юридический прецедент и продолжать опираться на доктрину «добросовестного использования» (fair use) — норму американского авторского права, разрешающую при определённых условиях использовать защищённые произведения без согласия правообладателя.
Общий объем использованных пиратских материалов оценивается в 267 Тбайт, что эквивалентно сотням миллионов публикаций. Истцы заявляют, что ИИ-система Meta теперь генерирует заменители их произведений, имитируя авторский стиль.
В свою очередь, представители Meta заявляют о намерении агрессивно оспаривать иск, ссылаясь на те же нормы «добросовестного использования».