В деле об авторских правах на ИИ Цукерберг обращается за защитой к YouTube

Генеральный директор Meta Марк Цукерберг, похоже, использовал YouTube и его борьбу для удаления пиратского контента, чтобы защитить использование своей собственной компанией набора данных, содержащих защищенные авторским правом электронные книги, для обучения моделей искусственного интеллекта, как показывают недавно опубликованные фрагменты его показаний.

Показания, которые были частью жалобы, поданной в суд адвокатами истцов, связаны с делом об авторских правах AI «Кадрей против Меты». Это одно из многих подобных дел, проходящих через судебную систему США, в которой компании, занимающиеся искусственным интеллектом, противопоставляются авторам и другим владельцам интеллектуальной собственности. По большей части ответчики по этим делам — компании, занимающиеся искусственным интеллектом, — заявляют, что обучение контенту, защищенному авторским правом, является «добросовестным использованием». Многие правообладатели с этим не согласны.

«Например, я думаю, что YouTube может в конечном итоге размещать некоторые материалы, которые люди пиратствуют в течение некоторого периода времени, но YouTube пытается удалить эти материалы», — сказал Цукерберг во время своих показаний, согласно частям стенограммы, опубликованной в среду. ночь. «И я предполагаю, что подавляющее большинство материалов на YouTube довольно хороши, и у них есть на это лицензия».

Отрывки показаний Цукерберга дают некоторые подсказки о взглядах Цукерберга на содержание авторских прав и добросовестное использование. Однако следует отметить, что полная стенограмма показаний не была опубликована. TechCrunch обратился к Meta за дополнительной информацией и обновит статью, если компания ответит.

Судя по самородкам осаждения, Цукерберг, похоже, защищает использование Meta набора обучающих данных электронных книг под названием LibGen для разработки своего семейства моделей искусственного интеллекта, известного как Llama. Llama от Meta конкурирует с флагманскими моделями таких компаний, занимающихся искусственным интеллектом, как OpenAI.

LibGen, который называет себя «агрегатором ссылок», предоставляет доступ к произведениям, защищенным авторским правом, от таких издателей, как Cengage Learning, Macmillan Learning, McGraw Hill и Pearson Education. На LibGen несколько раз подали в суд, приговорили к закрытию и оштрафовали на десятки миллионов долларов за нарушение авторских прав.

Согласно судебным документам, обнародованным на этой неделе, Цукерберг якобы разрешил использование LibGen для обучения по крайней мере одной из моделей Llama компании Meta, несмотря на опасения руководителей компании по искусственному интеллекту и исследовательских групп по поводу юридических последствий.

Адвокат истцов, в число которых входят авторы бестселлеров Сара Сильверман и Та-Нехиси Коутс, процитировал сотрудников Meta, которые назвали LibGen «набором данных, который, как мы знаем, является пиратским», и отметили, что его использование «может подорвать позицию (Meta) на переговорах с регулирующими органами. », согласно юридическому документу,

Во время своих показаний Цукерберг заявил, что «на самом деле не слышал» о LibGen.

«Я понимаю, что вы пытаетесь заставить меня высказать мнение о LibGen, о котором я действительно не слышал», — сказал Цукерберг во время дачи показаний. «Просто у меня нет знаний об этой конкретной вещи».

На допросе одного из адвокатов истцов, Дэвида Бойса, Цукерберг объяснил, почему было бы неразумно запрещать использование такого набора данных, как LibGen.

«Хотел бы я иметь политику против людей, использующих YouTube, потому что часть контента может быть защищена авторским правом? Нет», — сказал он. «(T)есть случаи, когда такой полный запрет может быть неправильным».

Цукерберг заявил, что Мете следует «очень осторожно» относиться к обучению материалам, защищенным авторским правом.

«Вы знаете, (если есть) кто-то, кто предоставляет веб-сайт и намеренно пытается нарушить права людей… очевидно, это то, к чему мы хотели бы быть осторожными или осторожными в отношении того, как мы с ним взаимодействуем, или, возможно, даже помешать нашим командам участвовать в этом», — сказал Цукерберг во время своих показаний, согласно стенограмме.

Новые обвинения

Адвокаты истцов по делу Кадри против Меты несколько раз вносили поправки в жалобу с тех пор, как она была подана в Окружной суд США Северного округа Калифорнии, округ Сан-Франциско, в 2023 году. Последняя жалоба с поправками, поданная адвокатом истцов поздно вечером в среду, содержит новые обвинения против Meta, в том числе о том, что компания сопоставила некоторые пиратские книги в LibGen с книгами, защищенными авторским правом, доступными по лицензии. Юристы утверждают, что Meta использовала эту тактику, чтобы определить, имеет ли смысл заключать лицензионное соглашение с издателем.

Согласно измененной документации, Meta предположительно использовала LibGen для обучения своего последнего семейства моделей Llama, Llama 3. Истцы также утверждают, что Meta использует набор данных для обучения своих моделей Llama 4 следующего поколения.

Согласно измененному документу, исследователи Meta якобы пытались скрыть тот факт, что модели Llama обучались на материалах, защищенных авторским правом, путем вставки «контролируемых образцов» в тонкую настройку Llama. А совсем недавно, в апреле 2024 года, как утверждается в исправленной жалобе, Meta загрузила пиратские электронные книги из другого источника, Z-Library, для обучения лам.

Z-Library, или Z-Lib, стала объектом ряда судебных исков, возбужденных издателями, включая конфискацию и удаление доменов. В 2022 году гражданам России, которые предположительно поддерживали его, были предъявлены обвинения в нарушении авторских прав, мошенничестве и отмывании денег.

Previous post Представители сделок опасаются, что дипломатия Трампа заморозит трансграничные сделки
Next post Британский Стармер подпишет 100-летний договор с Зеленским в Украине – POLITICO