
Некоммерческий Creative Commons, который возглавил лицензионное движение, которое позволяет создателям делиться своими работами при сохранении авторских прав, теперь готовится к эпохе ИИ. В среду организация объявила о запуске нового проекта, CC Signals, который позволит держателям набора данных подробно описать, как их контент может или не может быть использован повторными машинами, как в случае обучающих моделей ИИ.
Идея предназначена для создания баланса между открытым характером Интернета и спросом на все больше данных для питания ИИ.
Как объясняет Creative Commons в сообщении в блоге, продолжающаяся извлечение данных может разрушить открытость в Интернете и может видеть, что сущности обливают свои сайты или охраняют их с помощью Paywalls, вместо того, чтобы делиться доступом к своим данным.
Проект CC Signals, с другой стороны, направлен на предоставление юридического и технического решения, которое обеспечит основу для обмена наборами данных, предназначенных для использования между теми, кто контролирует данные, и теми, кто использует их для обучения ИИ.
Спрос увеличивается для такого инструмента, поскольку компании сталкиваются с изменением своих политик и условий обслуживания, чтобы ограничить обучение ИИ по своим данным, либо объяснить, в какой степени они будут использовать данные пользователей для целей, связанных с ИИ.
Например, X первоначально внес изменения, которые позволили третьим сторонам обучать свои модели своим публичным данным, а затем изменил это. Reddit использует свой файл robots.txt, который предназначен для того, чтобы сообщить автоматизированные веб -сканеры, могут ли они получить доступ к его сайту, чтобы ограничить ботов от соскоба его данных для обучения ИИ. CloudFlare обращается к решению, которое будет заряжать ботов AI для соскоба, а также инструменты для их смущения. И разработчики с открытым исходным кодом также создали инструменты, чтобы замедлить и тратить ресурсы Clawlers, которые не уважали их директивы «без сканирования».
Вместо этого проект CC Signals предлагает другое решение: набор инструментов, которые предлагают ряд юридических обязательств, но все из которых имеют этический вес, аналогичный лицензиям CC, которые сегодня охватывают миллиарды открыто лицензированных творческих работ в Интернете.
«Сигналы CC предназначены для поддержания Commons в эпоху ИИ», — сказала Анна Тумадоттир, генеральный директор Creative Commons, в объявлении. «Подобно тому, как лицензии CC помогли создать открытую сеть, мы считаем, что сигналы CC помогут сформировать открытую экосистему ИИ, основанную на взаимности».
Проект только сейчас начинает обретать форму. Ранние дизайны были опубликованы на веб -сайте CC и на странице Github. Организация активно ищет общественные отзывы в преддверии своих планов по запуску альфа (Early Test) в ноябре 2025 года. В ней также будет представлена серия ратуши для обратной связи и вопросов.