Новый день, новый спор вокруг искусственного интеллекта. На этот раз Meta была обвинена в использовании пиратского контента с торрентов для обучения своей большой языковой модели Llama, которая поддерживает Meta AI. Это дело стало одним из первых исков об авторских правах, поданных против технологической компании, обучающей ИИ.

Как сообщает Wired, в 2023 году на Meta был подан иск по обвинению в обучении Llama, LLM компании, пиратскому контенту. Дело стало известно как «Кадрей и др. против Meta Platforms» и было подано романистами Ричардом Кэдри и Кристофером Голденом, которые утверждали, что Meta использовала контент, защищенный авторским правом, без разрешения.

До сих пор Мета передавала в суд документы с отредактированной информацией, но судья Винс Чабрия из Окружного суда США Северного округа Калифорнии распорядился обнародовать оригиналы документов — что и произошло.

Документы раскрывают разговоры между сотрудниками Meta о Meta AI и Llama. В одном из разговоров инженер говорит, что «загрузка торрентов с корпоративного ноутбука неудобна», что подтверждает тот факт, что компания использовала пиратский контент для обучения своего ИИ. Другой разговор предполагает, что «МЗ» санкционировал использование пиратского материала.

Имеющиеся данные свидетельствуют о том, что Meta использовала контент из LibGen, огромной библиотеки пиратских книг, журналов и научных статей. LibGen был создан в России в 2008 году и с тех пор стал объектом множества исков о нарушении авторских прав, хотя никто не знает, кто на самом деле управляет «пиратским центром». Сообщается, что Meta также использовала контент из других «теневых библиотек» для обучения ИИ.