Meta обвиняют в обучении своего ИИ с использованием пиратского контента с торрентов
Новый день, новый спор вокруг искусственного интеллекта. На этот раз Meta была обвинена в использовании пиратского контента с торрентов для обучения своей большой языковой модели Llama, которая поддерживает Meta AI. Это дело стало одним из первых исков об авторских правах, поданных против технологической компании, обучающей ИИ.\n\nКак сообщает Wired, в 2023 году на Meta был подан иск по обвинению в обучении Llama, LLM компании, пиратскому контенту. Дело стало известно как «Кадрей и др. против Meta Platforms» и было подано романистами Ричардом Кэдри и Кристофером Голденом, которые утверждали, что Meta использовала контент, защищенный авторским правом, без разрешения.\n\nДо сих пор Мета передавала в суд документы с отредактированной информацией, но судья Винс Чабрия из Окружного суда США Северного округа Калифорнии распорядился обнародовать оригиналы документов — что и произошло.\n\nДокументы раскрывают разговоры между сотрудниками Meta о Meta AI и Llama. В одном из разговоров инженер говорит, что «загрузка торрентов с корпоративного ноутбука неудобна», что подтверждает тот факт, что компания использовала пиратский контент для обучения своего ИИ. Другой разговор предполагает, что «МЗ» санкционировал использование пиратского материала.\n\nИмеющиеся данные свидетельствуют о том, что Meta использовала контент из LibGen, огромной библиотеки пиратских книг, журналов и научных статей. LibGen был создан в России в 2008 году и с тех пор стал объектом множества исков о нарушении авторских прав, хотя никто не знает, кто на самом деле управляет «пиратским центром». Сообщается, что Meta также использовала контент из других «теневых библиотек» для обучения ИИ.