OpenAI не смогла предоставить обещанный к 2025 году инструмент отказа от участия

Еще в мае OpenAI заявила, что разрабатывает инструмент, позволяющий авторам указывать, как их работы должны быть включены в данные обучения ИИ или исключены из них. Но спустя 7 месяцев эта функция так и не увидела свет.

Этот инструмент, получивший название Media Manager, будет «идентифицировать текст, изображения, аудио и видео, защищенные авторским правом», как тогда заявила OpenAI, чтобы отразить предпочтения создателей «из нескольких источников». Это было сделано для того, чтобы отпугнуть самых яростных критиков компании и потенциально защитить OpenAI от юридических проблем, связанных с IP.

Но знакомые люди рассказали TechCrunch, что этот инструмент редко рассматривался как важный запуск внутри компании. «Я не думаю, что это было приоритетом», — сказал один из бывших сотрудников OpenAI. «Честно говоря, я не помню, чтобы кто-то над этим работал».

Не являющийся сотрудником компании, который координирует работу с компанией, рассказал TechCrunch в декабре, что они обсуждали этот инструмент с OpenAI в прошлом, но в последнее время не было никаких обновлений. (Эти люди отказались называть себя публично, обсуждая конфиденциальные деловые вопросы.)

А член юридической команды OpenAI, работавший над Media Manager, Фред фон Ломанн, в октябре перешел на должность консультанта на неполный рабочий день. Менеджер по связям с общественностью OpenAI подтвердил переход Фон Ломанна на TechCrunch по электронной почте.

OpenAI еще не предоставила обновленную информацию о ходе работы над Media Manager, и компания пропустила добровольно установленный срок для внедрения инструмента к 2025 году.

проблемы интеллектуальной собственности

Модели ИИ, такие как OpenAI, изучают закономерности в наборах данных, чтобы делать прогнозы — например, что человек, откусывающий гамбургер, оставит след от укуса. Это позволяет моделям в некоторой степени узнавать, как устроен мир, наблюдая за ним. ChatGPT может писать убедительные электронные письма и эссе, а Sora, видеогенератор OpenAI, может создавать относительно реалистичные кадры.

Возможность использовать примеры писательства, фильмов и т. д. для создания новых произведений делает ИИ невероятно мощным. Но это также и регургитация. При определенном запросе модели — большинство из которых обучены на бесчисленных веб-страницах, видео и изображениях — создают почти копии этих данных, которые, несмотря на то, что они «общедоступны», не предназначены для использования таким образом.

Например, Sora может создавать клипы с логотипом TikTok и персонажами популярных видеоигр. Газета New York Times заставила ChatGPT цитировать ее статьи дословно (OpenAI обвинила в этом «взлом»).

Понятно, что это расстроило авторов, чьи работы были использованы в рамках обучения ИИ без их разрешения. Многие обратились к адвокату.

OpenAI борется с коллективными исками, поданными художниками, писателями, ютуберами, учеными-компьютерщиками и новостными организациями, которые утверждают, что стартап обучался на их работах незаконно. В число истцов входят писатели Сара Сильверман и Та Нехиси-Коутс, художники и медиа-конгломераты, такие как The New York Times и Radio-Canada, и это лишь некоторые из них.

OpenAI заключила лицензионные соглашения с избранными партнерами, но не все создатели считают эти условия привлекательными.

OpenAI предлагает создателям несколько специальных способов «отказаться» от обучения ИИ. В сентябре прошлого года компания запустила форму подачи заявок, позволяющую художникам помечать свои работы для удаления из будущих обучающих наборов. А OpenAI уже давно позволяет веб-мастерам блокировать сканирование веб-ботами данных в их доменах.

Но создатели раскритиковали эти методы как бессистемные и неадекватные. Специальных механизмов отказа для письменных произведений, видео или аудиозаписей не существует. А форма отказа от изображений требует отправки копии каждого изображения для удаления вместе с описанием, что является обременительным процессом.

Сегодня Media Manager был представлен как полная модернизация и расширение решений OpenAI по отказу от участия.

В майском анонсе OpenAI заявила, что Media Manager будет использовать «передовые исследования в области машинного обучения», чтобы позволить создателям и владельцам контента «рассказывать (OpenAI), чем они владеют». OpenAI, заявившая, что сотрудничает с регулирующими органами при разработке инструмента, выразила надежду, что Media Manager «установит стандарт во всей индустрии искусственного интеллекта».

С тех пор OpenAI никогда публично не упоминал Media Manager.

Представитель сообщил TechCrunch, что по состоянию на август инструмент «все еще находился в разработке», но не ответил на последующий запрос о комментариях в середине декабря.

OpenAI не сообщила, когда может быть запущен Media Manager — или даже с какими функциями и возможностями он может быть запущен.

Добросовестное использование

Предполагая, что Media Manager в какой-то момент появится, эксперты не уверены, что он развеет опасения создателей или поможет решить юридические вопросы, связанные с использованием ИИ и IP.

Адриан Сайхан, адвокат по интеллектуальной собственности в Stubbs Alderton & Markiles, отметил, что описанный Media Manager — амбициозная задача. Даже такие крупные платформы, как YouTube и TikTok, сталкиваются с проблемой идентификации контента в больших масштабах. Может ли OpenAI действительно добиться большего?

«Обеспечение соблюдения законодательно требуемой защиты авторов и рассматриваемых требований к потенциальной компенсации представляет собой проблему», — сказал Сайхан TechCrunch, — «особенно с учетом быстро меняющейся и потенциально различающейся правовой среды в национальных и местных юрисдикциях».

Эд Ньютон-Рекс, основатель Fairly Trained, некоммерческой организации, которая удостоверяет, что компании, занимающиеся искусственным интеллектом, уважают права создателей, считает, что Media Manager несправедливо переложит бремя контроля за обучением искусственного интеллекта на создателей; не используя его, они, возможно, могли бы дать молчаливое согласие на использование своих работ. «Большинство авторов даже не услышат об этом, не говоря уже о том, чтобы использовать его», — сказал он TechCrunch. «Но, тем не менее, оно будет использовано для защиты массовой эксплуатации творческих работ против воли создателей».

Майк Борелла, сопредседатель группы практики искусственного интеллекта MBHB, отметил, что системы отказа не всегда учитывают преобразования, которые могут быть внесены в произведение, например, в изображение, которое было уменьшено. Они также могут не учитывать общий сценарий, когда сторонние платформы размещают копии контента авторов, добавляет Джошуа Вейгенсберг, юрист по интеллектуальной собственности и СМИ компании Pryor Cashman.

«Авторы и правообладатели не контролируют и зачастую даже не знают, где их произведения появляются в Интернете», — сказал Вайгенсберг. «Даже если создатель сообщит каждой платформе искусственного интеллекта, что он отказывается от обучения, эти компании вполне могут продолжить обучение на копиях своих работ, доступных на сторонних веб-сайтах и ​​сервисах».

Media Manager, возможно, даже не будет особенно выгоден для OpenAI, по крайней мере, с юридической точки зрения. Эван Эверист, партнер Dorsey & Whitney, специализирующийся на авторском праве, сказал, что, хотя OpenAI может использовать этот инструмент, чтобы продемонстрировать судье, что он снижает уровень обучения контенту, защищенному IP, Media Manager, скорее всего, не защитит компанию от убытков, если бы это было так. признано нарушившим.

«Владельцы авторских прав не обязаны выходить и заранее говорить другим, чтобы они не нарушали их произведения, прежде чем это нарушение произойдет», — сказал Эверист. «Основы закона об авторском праве по-прежнему действуют — то есть не брать и не копировать чужие материалы без разрешения. Эта функция может быть больше связана с пиаром и позиционированием OpenAI как этичного пользователя контента».

Расплата

В отсутствие Media Manager OpenAI внедрила фильтры — хотя и несовершенные — чтобы предотвратить извержение обучающих примеров в своих моделях. И в судебных процессах, с которыми она борется, компания продолжает заявлять о защите добросовестного использования, утверждая, что ее модели создают преобразующие, а не плагиатные произведения.

OpenAI вполне может победить в спорах об авторских правах.

Суды могут решить, что ИИ компании преследует «преобразующую цель», следуя прецеденту, созданному примерно десять лет назад в иске издательской индустрии против Google. В этом случае суд постановил, что копирование Google миллионов книг для Google Books, своего рода цифрового архива, разрешено.

OpenAI публично заявила, что было бы «невозможно» обучать конкурентоспособные модели ИИ без использования материалов, защищенных авторским правом, независимо от того, разрешено оно или нет. «Ограничение обучающих данных книгами и рисунками, являющимися общественным достоянием, созданными более века назад, может стать интересным экспериментом, но не обеспечит системы искусственного интеллекта, отвечающие потребностям сегодняшних граждан», — написала компания в январском заявлении, поданном в Палату лордов Великобритании. .

Если суды в конечном итоге объявят победу OpenAI, Media Manager не будет служить большой юридической цели. OpenAI, похоже, готова сделать эту ставку — или пересмотреть свою стратегию отказа.

Previous post Родители частных школ с сегодняшнего дня сталкиваются с более высокими сборами, поскольку вступает в силу политика НДС | Новости политики
Next post Счета домохозяйств могут вырасти почти на 270 фунтов стерлингов в апреле, предполагает анализ Sky News | Денежные новости