Предъявлен коллективный иск: Apple обвиняют в сборе миллионов видео с YouTube для обучения ИИ
Масштабируемая генерация видео на основе текста и изображений», в котором они заявляют об использовании набора данных Panda-70M для обучения описанной в работе модели генерации видео. Из текста иска: Набор данных Panda 70M функционирует, как карта или индексный файл, идентифицирующий конкретные видео и фрагменты с YouTube по URL-адресу, идентификатору видео и временной метке. Одно видео YouTube может быть разделено на множество клипов, каждый из которых рассматривается, как отдельный обучающий образец. Извлечение любого клипа требует независимого доступа к... Истцы утверждают, что их контент встречается в наборе данных более 500 раз, и стремятся представлять интересы «всех других лиц, находящихся в аналогичной ситуации», в рамках предлагаемого коллективного иска. По сути, они утверждают, что, хотя набор данных содержит только ссылки на видео, Apple, предположительно, обошла защиту YouTube от парсинга, чтобы загрузить и использовать исходный контент для обучения своих ИИ-моделей. По этой причине они требуют рассмотрения всех требований судом присяжных и ходатайствуют о... Помимо Apple, истцы подали коллективные иски против Amazon и OpenAI, утверждая, что обе компании также использовали набор данных Panda-70M в своих процессах обучения ИИ-моделей.