Чи є порушенням закону про авторські права перегляд зображень в Інтернеті? Роз'яснення юридичних проблем машинного навчання
У останні роки прогрес технології AI (штучний інтелект) є дивовижним, і різноманітні AI, такі як генератори зображень “Stable Diffusion” та “Midjourney”, а також “ChatGPT”, який генерує тексти, привертають увагу. Завдяки кроулінгу даних в Інтернеті та навчанню AI на цих даних, можливо робити різноманітні речі за допомогою AI, а точність машинного навчання покращується. Однак, вказується на ризик порушення закону про авторські права.
Чи не порушується закон про авторські права, якщо кроулінг різноманітних даних, таких як зображення та ілюстрації, опублікованих в Інтернеті, збирається без дозволу, обробляється та використовується для машинного навчання AI?
У цій статті ми розглянемо юридичні проблеми використання зображень та ілюстрацій, опублікованих в Інтернеті, для машинного навчання.
Що таке машинне навчання
Машинне навчання (ML: Machine Learning) – це процес, коли машина вчиться з даних, подібно до того, як людина вчиться з досвіду. У процесі машинного навчання необхідно збирати дані, вибирати та обробляти ці дані, щоб створити набір даних для навчання.
Кроулінг – це процес, коли програма, відома як кроулер, обходить веб-сайти, копіює та зберігає інформацію, таку як текст та зображення, з веб-сторінок.
Пов’язана стаття: Що таке скрапінг? Пояснюємо юридичні проблеми популярного методу збору даних[ja]
Проблеми з авторським правом у машинному навчанні
“Авторське право” – це, простими словами, право, яке юридично захищає твори. Щодо “творів”, які захищаються, вони визначені в статті 2 пункт 1 Японського закону про авторське право наступним чином:
(Визначення)
Стаття 2. У цьому законі терміни, зазначені в наступних пунктах, мають значення, визначені в відповідних пунктах.
1. Твір – це творче вираження думок або почуттів, яке належить до сфери літератури, науки, мистецтва або музики.
Контекст змін в законі про авторське право в 2018 році (Рік Хейсей 30)
У 2018 році (Рік Хейсей 30) було прийнято зміни до Японського закону про авторське право, які набули чинності з 1 січня 2019 року (Рік Хейсей 31).
Для використання технологій, таких як IoT, Big Data, AI (штучний інтелект), необхідно забезпечити можливість накопичення, комбінування та аналізу великої кількості інформації, включаючи твори. Тому в цих змінах було встановлено положення, яке дозволяє використовувати твори в певних випадках, наприклад, коли вони не використовуються з метою споживання.
Що дозволяє стаття 30-4 Японського закону про авторське право?
У статті 30-4 Японського закону про авторське право, яка була змінена в 2018 році, “використання, яке не має на меті насолоджуватися думками або почуттями, вираженими в творі”, дозволяється в необхідному обсязі, незалежно від методу, для використання твору.
(Використання, яке не має на меті насолоджуватися думками або почуттями, вираженими в творі)
Стаття 30-4. Твір можна використовувати в будь-який спосіб, в межах, визнаних необхідними, у випадках, зазначених нижче, та в інших випадках, коли метою не є насолодження думками або почуттями, вираженими в творі, самостійно або залученням інших осіб. Однак, це не стосується випадків, коли, враховуючи тип твору, його призначення та спосіб використання, це може несправедливо зашкодити інтересам автора.
1. Використання для тестування розробки або практичного застосування технології, пов’язаної з записом, відеозаписом або іншим використанням твору
2. Використання для аналізу інформації (витягування інформації, пов’язаної з мовою, звуком, зображенням або іншими елементами, що складають дані з багатьох творів або інших великих обсягів інформації, та проведення порівняння, класифікації або іншого аналізу. Те ж саме стосується пункту 2 пункту 1 статті 47-5.)
3. Використання твору в процесі обробки інформації за допомогою комп’ютера або іншого використання (за винятком виконання твору програми на комп’ютері), яке не включає визнання людиною виразу твору, крім випадків, зазначених у пунктах 1 та 2.
Конкретно, використання творів дозволяється в таких випадках:
・Дії, спрямовані на тестове відтворення творів мистецтва для розробки камер або принтерів, придатних для відтворення творів мистецтва
・Дії, спрямовані на збір та використання творів як навчальних даних для розробки штучного інтелекту, а також надання зібраних навчальних даних третім особам з метою розробки штучного інтелекту (передача або публічна передача тощо)
・Дії, спрямовані на копіювання творів на бекенді в процесі обробки інформації комп’ютером та використання цих даних без будь-якого сприйняття людиною
・Використання творів програм з метою дослідження та аналізу (так званий “реверсний інжиніринг”)
Цитата: Агентство культури | Закон про зміну частини закону про авторське право (Закон 2018 року № 30)[ja]
Випадки, коли використання творів у машинному навчанні може порушувати авторське право
Таким чином, збір, обробка та використання зображень (творів) для машинного навчання, а також надання зібраних даних для навчання третім особам (продаж, передача тощо) дозволені за статтею 30-4 пункт 2 Японського закону про авторське право. Однак таке використання творів може призвести до юридичних проблем.
Розглянемо можливі юридичні проблеми, які можуть виникнути при використанні зображень, опублікованих в Інтернеті, для машинного навчання.
Пов’язана стаття: До якої міри можна використовувати інформацію з Інтернету? Пояснення авторського права в Інтернеті[ja]
У випадку, коли це несправедливо шкодить інтересам власника авторського права
Стаття 30-4 Японського закону про авторське право дозволяє “використання, що не має на меті насолоду від ідей або емоцій, виражених у творі”, але не дозволяє використання творів, яке несправедливо шкодить інтересам власника авторського права.
Які конкретні випадки можна розглянути? Згідно з Q&A від Агентства культури, наступні випадки вважаються “випадками, коли це несправедливо шкодить інтересам власника авторського права”.
Конкретне рішення приймається в судовому порядку, але, наприклад, якщо твір у вигляді бази даних, який організує велику кількість інформації у формі, що легко використовується для аналізу інформації, продається, то дії, такі як копіювання цієї бази даних з метою аналізу інформації, вважаються “випадками, коли це несправедливо шкодить інтересам власника авторського права”, оскільки вони конфліктують з ринком продажу цієї бази даних.
Цитата: Відділ авторського права Агентства культури | “Основні принципи щодо гнучкого обмеження прав у відповідь на прогрес цифровізації та мережевої інтеграції”[ja]
У випадку, коли була укладена угода, яка відрізняється від положень закону про авторське право
Закон про авторське право дозволяє використання творів для машинного навчання, але сторони можуть укласти угоду, яка відрізняється від цього. Якщо така угода була укладена, то в разі порушення угоди може бути вимагана відповідальність за збитки.
Наприклад, на деяких сайтах в умовах використання або ліцензійних угодах може бути явно заборонено збирати та витягувати дані для машинного навчання або аналізу інформації. При зборі даних вам потрібно перевірити умови використання та ліцензійні угоди цього сайту.
Зазвичай, для “погодження” з умовами використання сайту вимагається певна дія. Наприклад, “створенням облікового запису ви погоджуєтеся з умовами використання та політикою конфіденційності”, а також вимагається реєстрація або натискання кнопки погодження. “Погодження” вважається укладеним шляхом натискання кнопки реєстрації або погодження.
З іншого боку, якщо умови використання, які забороняють збір та витягування даних, просто відображаються на сторінці сайту, відмінній від сторінки завантаження, і можливе завантаження зображень без погодження з ними, то “погодження” не вважається укладеним. У цьому випадку застосовуються положення закону про авторське право, і ви можете використовувати твір.
Однак, для запобігання проблемам, краще утриматися від збору даних з сайтів, які явно забороняють збір та витягування даних в умовах використання.
Пов’язана стаття: Що таке скрейпінг? Пояснення юридичних проблем популярного методу збору даних[ja]
Чи порушує авторське право зображення, синтезовані за допомогою машинного навчання?
До цього моменту ми розглядали, що використання творів у машинному навчанні визнається допустимим за законодавством про авторське право. Але чи порушує AI, який проводить машинне навчання та створює синтезовані зображення, авторські права на зображення (фотографії, ілюстрації, живопис тощо), які були використані для навчання?
Тут ми розглянемо випадок, коли AI використовує GAN (Generative Adversarial Networks – генеративні конкурентні мережі) для генерації зображень.
Принцип генерації зображень за допомогою машинного навчання
GAN (Generative Adversarial Networks – генеративні конкурентні мережі) – це одна з моделей генерації, яка може генерувати неіснуючі дані або трансформувати існуючі дані, вивчаючи їх характеристики. Цей принцип генерації зображень за допомогою GAN, наприклад, використовується в сервісах, які аналізують фотографії або малюнки реальних кімнат і синтезують зображення, ніби меблі, що відповідають бюджету або розміру кімнати, дійсно там розташовані.
Чи може AI порушити авторські права на зображення, які були використані для машинного навчання?
GAN складається з двох нейронних мереж: генератора (Generator) та дискримінатора (Discriminator). Генератор перетворює характеристики вихідного зображення на числові значення, а потім вводить певні змінні, щоб вивести числові значення, що були скориговані цими змінними, та генерує синтезоване зображення.
Отже, синтезоване зображення – це зображення, що було новоствореним в результаті введення змінних в функцію під час процесу синтезу, тому воно може бути вважене абсолютно відмінним від вихідних даних зображення (фотографії, ілюстрації, живопису тощо). Навіть якщо в результаті машинного навчання було синтезовано зображення, схоже на вихідне, воно не вважається копіюванням, перекладом або модифікацією вихідних даних для навчання.
Тому можна стверджувати, що синтезовані зображення, створені AI за допомогою машинного навчання, не порушують авторські права на вихідні зображення, використані для машинного навчання.
Пов’язана стаття: Як захищаються інтелектуальні права при розробці AI? Розгляд питань авторського права та патентного права[ja]
Підсумок: Звертайтеся до адвоката з питань AI, машинного навчання та авторських прав
У цій статті ми розглянули проблеми авторського права, пов’язані з використанням зображень, опублікованих в Інтернеті, для машинного навчання AI.
Використання творів для машинного навчання дозволено законом про авторські права (стаття 30-4 Японського закону про авторські права). Однак, винятково, використання творів може бути заборонено, якщо це несправедливо шкодить інтересам автора, або якщо сторони домовилися про умови, що відрізняються від положень закону про авторські права.
AI, такі як “Midjourney”, “Stable Diffusion”, “ChatGPT”, привертають увагу, і все більше компаній починають розробляти AI. Оскільки може бути важко визначити, чи дозволено використовувати твори як навчальні дані, які необхідні для розробки AI, ми рекомендуємо звертатися до адвоката, який спеціалізується на IT, якщо ви плануєте використовувати AI або машинне навчання в своєму бізнесі.
Інформація про заходи, що вживаються нашим бюро
Юридичне бюро “Моноліт” – це юридична фірма з багатим досвідом у сфері ІТ, особливо в області інтернету та права.
Бізнес, пов’язаний з ШІ, супроводжується багатьма юридичними ризиками, тому незамінною є підтримка адвокатів, які добре розуміють юридичні питання, пов’язані з ШІ. Наше бюро надає висококваліфіковану юридичну підтримку для бізнесу, пов’язаного з ШІ, включаючи ChatGPT, за допомогою команди адвокатів та інженерів, які спеціалізуються на ШІ. Ми надаємо послуги зі створення договорів, оцінки законності бізнес-моделей, захисту інтелектуальної власності, реагування на приватність та інше. Деталі ви знайдете в статті нижче.
Сфери діяльності юридичного бюро “Моноліт”: Правові питання ШІ (ChatGPT тощо)[ja]
Category: IT