MONOLITH LAW OFFICE+81-3-6262-3248Будни 10:00-18:00 JST [English Only]

MONOLITH LAW MAGAZINE

IT

Является ли краулинг изображений в Интернете нарушением авторского права? Объяснение юридических проблем машинного обучения

IT

Является ли краулинг изображений в Интернете нарушением авторского права? Объяснение юридических проблем машинного обучения

В последние годы прогресс в области AI (искусственного интеллекта) становится все более заметным, и различные AI, такие как AI для генерации изображений «Stable Diffusion» и «Midjourney», а также AI для генерации текстов, такие как «ChatGPT», привлекают все больше внимания. Используя AI для обучения на данных, собранных из интернета, становится возможным делать различные вещи, и хотя точность машинного обучения улучшается, указывается на риск нарушения авторских прав.

Не нарушает ли авторские права использование различных данных, таких как изображения и иллюстрации, опубликованные в интернете, собранные без разрешения и обработанные для использования в машинном обучении AI?

В этой статье мы обсудим юридические проблемы использования изображений и иллюстраций, опубликованных в интернете, для машинного обучения.

Что такое машинное обучение

Что такое машинное обучение

Машинное обучение (ML: Machine Learning) – это процесс, при котором машины учатся из данных, подобно тому, как люди учатся из опыта. В процессе машинного обучения необходимо собирать данные, выбирать и обрабатывать их, чтобы создать набор данных для обучения.

Краулинг – это процесс, в ходе которого программа, называемая краулером, обходит веб-сайты и копирует и сохраняет информацию, такую как текст и изображения, с веб-страниц.

Связанные статьи: Что такое скрапинг? Объясняем юридические вопросы популярного метода сбора данных[ja]

Проблемы с авторским правом в машинном обучении

“Авторское право” – это, в простых словах, право, которое юридически защищает произведения. И вот что говорится о “произведениях”, подлежащих защите, в статье 2, пункт 1 Японского закона об авторском праве.

(Определение)

Статья 2. В этом законе термины, указанные в следующих пунктах, имеют значение, определенное в соответствующих пунктах.

1. Произведение – это то, что творчески выражает мысли или чувства и относится к области литературы, науки, искусства или музыки.

Фон изменения закона об авторском праве в 2018 году (Год Хэйсей 30)

В 2018 году (Год Хэйсей 30), был принят измененный Закон об авторском праве, который вступил в силу 1 января 2019 года (Год Хэйсей 31).

Для использования технологий, таких как IoT, Big Data, AI (искусственный интеллект), необходимо обеспечить возможность накопления, комбинирования и анализа большого количества информации, включая произведения. Поэтому в этом изменении было установлено положение, разрешающее использование произведений в определенных случаях, когда они не используются для целей просмотра и т.д.

Что разрешено статьей 30-4 Закона об авторском праве

В статье 30-4 Закона об авторском праве, измененного в 2018 году, было установлено, что “использование, не предназначенное для наслаждения мыслями или чувствами, выраженными в произведении”, может быть разрешено в необходимом объеме, независимо от метода использования произведения.

(Использование, не предназначенное для наслаждения мыслями или чувствами, выраженными в произведении)

Статья 30-4. Произведение может быть использовано любым способом в пределах, признанных необходимыми, в следующих случаях и в других случаях, когда целью не является наслаждение мыслями или чувствами, выраженными в данном произведении, или предоставление такого наслаждения другим. Однако, это не относится к случаям, когда это может нанести несправедливый ущерб интересам автора произведения, учитывая тип и назначение данного произведения, а также характер использования.

1. Использование для тестирования в целях разработки или практического применения технологии, связанной с записью, записью на видео или другим использованием произведения

2. Использование для анализа информации (извлечение информации, связанной с языком, звуком, изображением или другими элементами, составляющими данную информацию, из большого количества произведений или другой большой информации, и проведение сравнения, классификации или другого анализа. То же самое относится к пункту 1, пункт 2, статья 47-5.)

3. Использование в процессе обработки информации с помощью электронного компьютера или другого использования (исключая выполнение произведения программы на электронном компьютере), которое не включает в себя восприятие выражения произведения человеком, кроме случаев, указанных в пунктах 1 и 2.

Конкретно, использование произведений разрешено в следующих случаях:

・Действия, связанные с экспериментальным воспроизведением произведений искусства для разработки камер или принтеров, подходящих для воспроизведения произведений искусства

・Действия, связанные с сбором и использованием произведений в качестве учебных данных для разработки искусственного интеллекта, или предоставлением собранных учебных данных третьим лицам в рамках цели разработки искусственного интеллекта (передача или публичная передача и т.д.)

・Действия, связанные с копированием произведений на бэкэнде компьютера и использованием этих данных без всякого восприятия человеком

・Действия, связанные с использованием произведений программ в целях исследования и анализа программ (так называемый “реверс-инжиниринг”)

Источник: Агентство культуры | О законе о частичном изменении закона об авторском праве (Закон Хэйсей 30, № 30)[ja]

Случаи, когда использование произведений в машинном обучении может нарушить авторское право

Случаи, когда использование произведений в машинном обучении может нарушить авторское право

Таким образом, сбор, обработка и использование изображений (произведений) для машинного обучения, а также предоставление собранных данных для обучения третьим лицам (продажа, передача и т.д.) допускаются в соответствии со статьей 30-4 пункт 2 Японского закона об авторском праве. Однако такое использование произведений может привести к юридическим проблемам.

Рассмотрим возможные юридические проблемы, которые могут возникнуть при использовании изображений, опубликованных в Интернете, для машинного обучения.

Связанные статьи: До какой степени можно использовать информацию в Интернете? Объяснение авторских прав в Интернете[ja]

Если это наносит несправедливый ущерб интересам автора

В статье 30-4 Японского закона об авторском праве, хотя и допускается “использование, не предназначенное для наслаждения идеями или эмоциями, выраженными в произведении”, не допускается использование произведения, если оно наносит несправедливый ущерб интересам автора.

Какие конкретные случаи можно рассмотреть? Согласно Q&A Агентства культуры, следующие случаи считаются “несправедливым ущербом для интересов автора”.

Конкретное решение принимается в суде, но, например, если произведение, представляющее собой базу данных, организованную таким образом, чтобы большое количество информации можно было легко использовать для анализа информации, продается, то действия по копированию этой базы данных с целью анализа информации могут считаться “несправедливым ущербом для интересов автора”, поскольку они конфликтуют с рынком продажи этой базы данных.

Цитата: Отдел авторского права Агентства культуры | “Основные идеи о гибком ограничении прав в ответ на цифровизацию и сетевизацию”[ja] 

Если было достигнуто соглашение, отличное от положений закона об авторском праве

Хотя Японский закон об авторском праве допускает использование произведений для машинного обучения, стороны могут достигнуть соглашения, отличного от этого. Если такое соглашение было заключено, то в случае его нарушения может возникнуть обязанность по возмещению ущерба.

Например, на некоторых сайтах в условиях использования или лицензионных соглашениях явно запрещено собирать и извлекать данные для машинного обучения или анализа информации. При сборе данных необходимо проверить условия использования или лицензионные соглашения этого сайта.

В общем, для “согласия” с условиями использования сайта требуется какое-то действие. Например, при создании учетной записи может быть указано, что “создание учетной записи считается согласием с условиями использования и политикой конфиденциальности”, и может потребоваться регистрация или нажатие кнопки согласия. “Согласие” достигается путем нажатия кнопки регистрации или согласия.

С другой стороны, если условия использования, запрещающие сбор и извлечение данных, размещены на странице сайта, отличной от страницы загрузки, и изображения можно загрузить, даже не соглашаясь с ними, то “согласие” не достигнуто. В этом случае применяются положения закона об авторском праве, и произведение можно использовать.

Тем не менее, чтобы предотвратить проблемы, лучше воздержаться от сбора данных с сайтов, которые явно запрещают сбор и извлечение данных в своих условиях использования.

Связанные статьи: Что такое скрапинг? Объяснение юридических проблем популярного метода сбора данных[ja]

Нарушает ли авторское право изображение, созданное с помощью машинного обучения?

Нарушает ли авторское право изображение, созданное с помощью машинного обучения?

Мы уже обсуждали, что использование произведений искусства для машинного обучения признается допустимым в рамках авторского права. Но нарушает ли AI, использующий машинное обучение для создания синтетических изображений, авторские права на исходные изображения (фотографии, иллюстрации, картины и т.д.)?

Здесь мы рассмотрим случай, когда AI использует GAN (Generative Adversarial Networks, Генеративные состязательные сети) для создания изображений.

Принцип создания изображений с помощью машинного обучения

GAN – это одна из моделей генерации, которая может создавать несуществующие данные или преобразовывать существующие данные в соответствии с их характеристиками, изученными из данных. Этот принцип создания изображений с помощью GAN, например, используется в сервисах, которые анализируют фотографии или рисунки реальных комнат и создают изображения, на которых мебель, подходящая по бюджету и размеру комнаты, выглядит так, как будто она действительно там стоит.

Может ли AI нарушить авторские права на исходные изображения, на которых он обучался?

GAN состоит из двух нейронных сетей: генератора (Generator) и дискриминатора (Discriminator). Генератор численно анализирует характеристики исходного изображения и, вводя определенные переменные, генерирует синтетическое изображение, выводя числа, скорректированные этими переменными.

Таким образом, синтетическое изображение – это новое изображение, созданное в результате ввода переменных в функцию в процессе синтеза, и оно является совершенно отдельным от исходных данных изображения (фотографии, иллюстрации, картины и т.д.). Даже если в результате машинного обучения было создано изображение, похожее на исходное, это не считается копированием, адаптацией или модификацией исходных данных для обучения.

Поэтому можно сказать, что синтетические изображения, созданные AI с помощью машинного обучения, не нарушают авторские права на исходные изображения, на которых он обучался.

Связанные статьи: Как защищаются интеллектуальные права при разработке AI? Обсуждение вопросов авторского права и патентных прав[ja]

Вывод: Обратитесь к адвокату по вопросам использования машинного обучения AI и проблем с авторским правом

В этой статье мы обсудили проблемы, связанные с авторским правом при использовании изображений, опубликованных в Интернете, для машинного обучения AI.

Использование произведений искусства для машинного обучения разрешено законом об авторском праве (Статья 30-4 Японского закона об авторском праве). Однако, в исключительных случаях, когда это наносит несправедливый ущерб интересам автора или когда стороны договорились о чем-то, что отличается от положений закона об авторском праве, использование произведения может быть запрещено.

AI, такие как “Midjourney”, “Stable Diffusion”, “ChatGPT”, привлекают все больше внимания, и число компаний, которые начинают разрабатывать новые AI, растет. Вопрос о том, можно ли использовать произведения искусства в качестве обучающих данных, которые необходимы для разработки AI, может быть сложным для принятия решения. Поэтому, если вы планируете использовать AI и машинное обучение в своем бизнесе, мы рекомендуем вам обратиться к адвокату, специализирующемуся на IT.

Информация о мерах, предпринимаемых нашей юридической фирмой

Юридическая фирма “Монолит” обладает богатым опытом в области IT, особенно в интернете и праве.

Бизнес, связанный с AI, несет в себе множество юридических рисков, и поддержка адвокатов, знакомых с юридическими вопросами AI, является неотъемлемой необходимостью. Наша фирма предоставляет высококачественную юридическую поддержку для бизнеса, связанного с AI, включая ChatGPT, с помощью команды адвокатов и инженеров, специализирующихся на AI. Мы предлагаем услуги по составлению договоров, проверке законности бизнес-моделей, защите интеллектуальной собственности, соблюдению приватности и т.д. Подробности приведены в статье ниже.

Сферы деятельности юридической фирмы “Монолит”: Юридические вопросы AI (включая ChatGPT и т.д.)[ja]

Managing Attorney: Toki Kawase

The Editor in Chief: Managing Attorney: Toki Kawase

An expert in IT-related legal affairs in Japan who established MONOLITH LAW OFFICE and serves as its managing attorney. Formerly an IT engineer, he has been involved in the management of IT companies. Served as legal counsel to more than 100 companies, ranging from top-tier organizations to seed-stage Startups.

Вернуться наверх