Марк Цукерберг дал команде Meta Llama разрешение на обучение работам, защищенным авторским правом, и подал иски

Адвокат истцов в иске об авторских правах, поданном против Meta, утверждает, что генеральный директор Meta Марк Цукерберг дал зеленый свет команде, разрабатывающей модели искусственного интеллекта Llama, использовать набор данных из пиратских электронных книг и статей для обучения.

Дело «Кадрей против Меты» — одно из многих против технологических гигантов, разрабатывающих ИИ, которые обвиняют компании в обучении моделей на произведениях, защищенных авторским правом, без разрешения. По большей части ответчики, такие как Мета, утверждают, что их защищает добросовестное использование, правовая доктрина США, которая позволяет использовать произведения, защищенные авторским правом, для создания чего-то нового, если это достаточно преобразует. Многие создатели отвергают этот аргумент.

В новых неотредактированных документах, поданных в окружной суд США Северного округа Калифорнии поздно вечером в среду, истцы по делу Кадри против Меты, в число которых входят авторы бестселлеров Сара Сильверман и Та-Нехиси Коутс, пересчитывают показания Меты, данные в конце прошлого года, в ходе которых было сообщил, что Цукерберг одобрил использование Meta набора данных под названием LibGen для обучения, связанного с ламами.

LibGen, который называет себя «агрегатором ссылок», предоставляет доступ к произведениям, защищенным авторским правом, от таких издателей, как Cengage Learning, Macmillan Learning, McGraw Hill и Pearson Education. На LibGen несколько раз подали в суд, приговорили к закрытию и оштрафовали на десятки миллионов долларов за нарушение авторских прав.

Согласно показаниям Meta, переданным адвокатом истцов, Цукерберг разрешил использование LibGen для обучения по крайней мере одной из моделей Meta Llama, несмотря на опасения в команде руководителей Meta по искусственному интеллекту и других сотрудников компании. В документе цитируются сотрудники Meta, которые называют LibGen «набором данных, который, как мы знаем, является пиратским», и отмечают, что его использование «может подорвать позицию (Meta) на переговорах с регулирующими органами».

В документе также цитируется памятка для лиц, принимающих решения в Meta AI, в которой отмечается, что после «эскалации в MZ» команде Meta по искусственному интеллекту «(было) разрешено использовать LibGen». (Здесь MZ — довольно очевидное сокращение от «Марк Цукерберг».)

Детали, по-видимому, совпадают с сообщением The New York Times в апреле прошлого года, в котором говорилось, что Meta срезала углы для сбора данных для своего ИИ. По данным Times, в какой-то момент Meta нанимала подрядчиков в Африке для составления обзоров книг и рассматривала возможность покупки издательства Simon & Schuster. Но руководители компании решили, что переговоры о лицензиях займут слишком много времени, и пришли к выводу, что добросовестное использование является надежной защитой.

Документы, поданные в среду, содержат новые обвинения, например, что Meta могла попытаться скрыть предполагаемое нарушение авторских прав, лишив данные LibGen информации об авторстве.

По словам адвоката истцов, инженер Meta Николай Башлыков, работающий в исследовательской группе Llama, написал скрипт для удаления информации об авторских правах, включая слова «авторское право» и «признания», из электронных книг в LibGen. Кроме того, Meta якобы удалила маркеры авторских прав из статей в научных журналах и «исходные метаданные» из обучающих данных, которые она использовала для Llama.

«Это открытие предполагает, что Meta удаляет (информацию об авторских правах) не только в учебных целях, — говорится в документе, — но и для того, чтобы скрыть нарушение авторских прав, поскольку удаление произведений, защищенных авторским правом… не позволяет Llama выводить информацию об авторских правах, которая могла бы предупредить пользователей Llama и общественность». к нарушению прав Меты».

Согласно последним документам, Meta также сообщила во время показаний, что использовала торрент LibGen, что заставило некоторых инженеров-исследователей Meta задуматься. Торрент, способ распространения файлов в сети, требует, чтобы торрентеры одновременно «раздавали» или загружали файлы, которые они пытаются получить.

Адвокат истцов утверждает, что Meta фактически участвовала в другой форме нарушения авторских прав, распространяя LibGen через торренты и тем самым помогая распространять его содержимое. Адвокат утверждает, что Meta также пыталась скрыть свою деятельность, сводя к минимуму количество загружаемых файлов.

Согласно документу, руководитель отдела генеративного искусственного интеллекта Meta Ахмад Ах-Дале «расчистил путь» для торрент-файла LibGen, отмахнувшись от сомнений Башлыкова о том, что это «может быть юридически недопустимо».

«Если бы Meta купила работы истцов в книжном магазине или взяла их в библиотеке и обучила бы на них свои модели лам без лицензии, она бы совершила нарушение авторских прав», — написал адвокат истцов в иске. «Решение Меты обойти законные методы приобретения книг и стать сознательным участником нелегальной торрент-сети… служит доказательством нарушения авторских прав».

Дело против Меты еще далеко от решения. На данный момент это относится только к самым ранним моделям Llama от Meta, а не к недавним выпускам. И суд вполне может принять решение в пользу Meta, если его убедит аргумент компании о добросовестном использовании.

Но обвинения не отражаются хорошо на Мете, как отметил председательствующий по делу судья Томас Хиксон в своем постановлении в среду, отклоняющем просьбу Меты отредактировать большую часть документов.

«Очевидно, что запрос Meta на опечатывание не предназначен для защиты от раскрытия конфиденциальной деловой информации, которую конкуренты могут использовать в своих интересах», — написал Хиксон. «Скорее, это сделано для того, чтобы избежать негативной огласки».

Мы обратились к Meta за комментариями и обновим эту статью, если получим ответ.

Previous post Илон Маск призывает Калифорнию и Делавэр провести аукцион по продаже доли OpenAI
Next post Феттерман станет первым действующим сенатором-демократом США, который посетит Трампа в Мар-а-Лаго