Чи може створення "голосу" за допомогою штучного інтелекту призвести до порушення авторських прав? (#1 Розробка та етап навчання)

Розвиток генеративного AI дозволив легко навчати та створювати “голоси” існуючих співаків чи озвучувачів. У бізнес-сценаріях, таких як розробка додатків, створення ігор чи анімації, стало можливим навчати AI “голосам” та генерувати нові “голоси”.
Навчання генеративного AI “голосам” реальних співаків чи озвучувачів та створення нових “голосів” може стати потенційним порушенням авторських прав або іншими незаконними діями під японським законодавством.
Наразі, щодо цих питань не існує чіткого тлумачення. Які ж юридичні права має “голос” і в яких випадках він може становити проблему з точки зору Закону про авторські права в Японії?
У цій статті ми розглянемо це питання, виходячи з конкретних сценаріїв використання, і обговоримо його у двох частинах. У цій першій частині ми розглянемо можливі порушення прав на етапі розробки та навчання генеративного AI. Юридичні проблеми, пов’язані з етапом генерації та використання, обговорюються в цій статті (#2 Етап генерації та використання)[ja]. Запрошуємо вас також ознайомитися з нею.
Три юридичні права, що оточують людський «голос» в Японії
Які юридичні права має людський «голос»? Розглядаючи це питання, необхідно враховувати два аспекти «голосу»:
- Що саме голос говорить,
- Як звучить цей голос.
Тобто, перший аспект стосується «змісту» голосу, а другий – «звуку» голосу.
Наприклад, якщо різні актори озвучення вимовляють фразу «Доброго ранку», то зміст першого аспекту залишається незмінним, але звук другого аспекту буде відрізнятися.
Виходячи з цих аспектів, в рамках чинного законодавства Японії можна виділити наступні три юридичні права, які можуть виникати у зв’язку з людським «голосом»:
① Авторське право | Може виникати щодо «змісту» голосу |
② Суміжні права (обмежені правами виконавців) | Може виникати щодо «змісту» та «звуку» голосу |
③ Право на публічність | Може виникати щодо «звуку» голосу |
Про авторське право в Японії
Авторське право виникає, коли “зміст” голосу відповідає критеріям твору, що охороняється авторським правом.
Наприклад, при читанні вголос відомого роману, на цей голос може виникнути авторське право. Однак важливо звернути увагу на те, що в такому випадку власником авторського права є автор цього роману, а не особа, яка читає – «власник голосу». Тобто, створення синтезованого голосу, який читає вміст відомого роману за допомогою генеративного AI, може порушувати авторські права автора роману.
У протилежному випадку, коли зміст голосу становить звичайну повсякденну розмову звичайних людей, на такий голос авторське право не виникає. Це пов’язано з тим, що звичайна повсякденна розмова сама по собі не вважається твором, що охороняється авторським правом, і не є об’єктом захисту за законом про авторське право.
Про суміжні права в Японії
Суміжні права (обмежені правами виконавців) можуть виникати, коли зміст голосу відповідає твору, наприклад, у випадках, коли голос супроводжується читанням вголос або іншою формою виконання.
Як зазначалося у попередньому розділі про авторське право, коли голос використовується для “читання вголос”, що є формою “виконання”, виконавець може мати суміжні права. Відмінно від випадку з авторським правом, важливо звернути увагу на те, що суміжні права належать не автору твору, а особі, яка фактично виконує читання вголос.
Про право на публічність в Японії
Право на публічність в Японії визначається як “право на ексклюзивне використання привабливості імені, зображення тощо особи для залучення клієнтів”, яке було визнане на основі судової практики (вердикт Верховного Суду від 2 лютого 2012 року (H24)).
▶︎Вердикт Верховного Суду від 2 лютого 2012 року (H24) (справа “Пінк Леді”) ■Зміст рішення ①Використання імені, зображення тощо самостійно як об’єкта оцінки у товарах, ②Прикріплення імені, зображення тощо до товарів з метою диференціації цих товарів, ③Використання імені, зображення тощо як реклами товарів з метою виключно використання привабливості імені, зображення тощо для залучення клієнтів, вважається порушенням права на публічність та незаконною дією ■Коментарі дослідника (Пояснення рішень Верховного Суду у цивільних справах за 2012 рік (H24), частина 1, стор. 18) У цьому рішенні під “зображенням тощо” розуміються інформація, що дозволяє ідентифікувати особу, що включає, наприклад, підпис, автограф, голос, псевдонім, сценічне ім’я тощо |
Згідно зі справою “Пінк Леді”, існує можливість виникнення права на публічність і для голосу. Якщо визнано, що голос належить реальній особі, такій як озвучувач, актор чи співак, який має привабливість для клієнтів, то право на публічність виникає незалежно від “змісту” цього голосу. І якщо цей голос використовується в одному з трьох випадків порушення, визначених у справі “Пінк Леді”, це вважається порушенням права на публічність.
Три сценарії використання на етапі розробки та навчання
Коли ми говоримо про “генерацію голосу за допомогою штучного інтелекту”, необхідно розрізняти два основних етапи процесу:
- Етап розробки та навчання
- Етап генерації та використання
Перший етап здійснюється розробниками AI, тоді як другий – користувачами AI.
Якщо схематично зобразити ці етапи, то вони виглядатимуть наступним чином:

На етапі розробки та навчання збирають та накопичують первинні дані людського голосу як навчальні дані для розробки AI, створюють набір даних для навчання. Після цього навчальний набір даних вводять в AI для машинного навчання та створення навченої моделі. Натомість на етапі генерації та використання вводять первинні дані в AI, який вже пройшов машинне навчання, для генерації та використання AI-продуктів.
На етапі розробки та навчання можна виділити наступні три сценарії використання:
- Сценарій 1: Збір, накопичення, обробка та використання даних людського голосу як навчальних даних для розробки AI
- Сценарій 2: Продаж або публікація набору навчальних даних, що використовуються для розробки AI
- Сценарій 3: Продаж або публікація самого генеративного AI
Далі ми коротко розглянемо, які порушення прав можуть виникнути в кожному з цих сценаріїв використання.
Патерн 1: Збір, накопичення, обробка та використання голосових даних людей як навчальних даних для розробки ШІ в Японії

Спочатку розглянемо можливі порушення прав, які можуть виникнути на етапі збору, накопичення, обробки та використання голосових даних людей для навчання штучного інтелекту.
Відносини з авторським правом
Дії, описані в Патерні 1, конкретно стосуються розробки самого штучного інтелекту. Розробка ШІ відповідає «аналізу інформації» за статтею 30-4 пункт 2 Закону про авторське право Японії, тому використання творів, необхідних для цього, за принципом не є порушенням авторських прав (стаття 30-4).
Проте існує важливий виняток. Якщо при створенні набору даних для навчання метою є створення штучних продуктів ШІ, які мають суттєві характеристики виразності оригінальних даних (з метою виразної виводу), то стаття 30-4 не застосовується, і такі дії можуть бути незаконними.
Тобто, якщо використовуються голосові дані інших акторів озвучення для відтворення або вшанування характерного голосу певного актора озвучення, існує мета виразного виводу, тоді таке використання може бути визнано порушенням авторських прав.
Відносини з суміжними правами
У відносинах з суміжними правами, стаття 102 також застосовує статтю 30-4 Закону про авторське право, тому виконання та інші дії для розробки ШІ, як правило, не є порушенням суміжних прав.
Відносини з правом на публічність
Питання права на публічність може виникнути, коли розробляється ШІ з метою створення голосу конкретної відомої особи.
Чи є порушенням права на публічність, можна визначити, виходячи з трьох типів порушень, описаних у справі “Пінк Леді”.
Спочатку, сам акт розробки ШІ з метою створення голосу конкретної відомої особи не відповідає трьом типам порушень, описаним у справі “Пінк Леді”. Проте, якщо така діяльність має на меті виключно використання привабливості імені, портрета тощо, то вона може становити порушення права на публічність і бути незаконною.
Для використання привабливості необхідно, щоб на етапі розробки ШІ, особливо при створенні набору даних для навчання, треті особи могли усвідомити, що це голос конкретної відомої особи. Якщо треті особи-клієнти цього не усвідомлюють, то приваблення клієнтів не відбувається. Однак, зазвичай на етапі розробки ШІ немає можливості для участі третіх осіб-клієнтів.
Отже, можна сказати, що такі дії майже не мають шансів бути визнаними порушенням права на публічність.
Патерн 2: Продаж та публікація навчальних даних, що використовуються для розробки ШІ в Японії
Тут ми розглянемо можливі порушення прав, які можуть виникнути на етапі продажу та публікації навчальних даних для ШІ.
Відносини з авторським правом
Якщо в навчальному датасеті збережені оригінальні дані в їх первісному форматі або вони були дещо оброблені, дії з продажу чи публікації такого датасету можуть становити порушення права на передачу авторських творів або похідних творів (стаття 28), а також порушення права на публічну трансляцію (стаття 23) за японським законодавством. Тому продаж або публікація без згоди власника авторського права вважається порушенням авторського права.
Проте, згідно зі статтею 30-4, “у випадках використання для аналізу інформації” дозволяється використовувати твори “в межах, визнаних необхідними, незалежно від методу”. Таким чином, якщо передача або публікація виконується для розробки генеративного ШІ, це не вважається порушенням авторського права, якщо це визнано необхідним.
Відносини з суміжними правами
Так само, як і вище, стаття 102 застосовує положення статті 30-4 до суміжних прав, тому продаж або публікація навчальних даних для розробки генеративного ШІ, як правило, не становить порушення суміжних прав.
Відносини з правом на публічність
У навчальних датасетах можуть зберігатися голоси конкретних відомих осіб у форматі, що дозволяє їх відтворення. Однак, навчальні датасети зазвичай використовуються лише для розробки генеративного ШІ і не можна стверджувати, що вони використовуються “як товари для незалежного споглядання, такі як ім’я чи портрет”, як це було визначено у вирішенні справи “Пінк Леді”.
Таким чином, можна сказати, що існує мало підстав для порушення права на публічність у такому використанні.
Патерн 3: Продаж та публікація самого генеративного AI

Тут ми розглянемо можливі порушення прав, які можуть виникнути на етапі продажу чи публікації навченої моделі генеративного AI.
Відносини з авторським правом
На відміну від наборів даних для навчання, у самому генеративному AI, а саме в навченій моделі, не можна уявити, що залишаються частини оригінальних даних (творів) з ознаками творчості. Тому можна стверджувати, що сам генеративний AI, або навчена модель, не є похідним твором оригінальних даних, і їх публікація чи продаж не становить порушення авторських прав.
Відносини з суміжними правами
Як і вище, не можна уявити, що в навченій моделі залишаються частини оригінальних даних з ознаками творчості, тому продаж чи публікація самого генеративного AI не порушує суміжних прав.
Відносини з правом на публічність
Навіть якщо AI може вільно та з високою точністю генерувати голос певної відомої особи, очевидно, що це не відповідає жодному з трьох типів порушень, визначених у вирішенні справи “Пінк Леді”. Проте, зазвичай такий AI приваблює клієнтів саме можливістю вільно та з високою точністю генерувати голос певної відомої особи, і клієнти зазвичай купують такий AI саме з цієї причини. Тому продаж такого AI може бути високою мірою розглянутий як порушення права на публічність через схожість з трьома типами порушень.
Підсумок: Консультуйтеся з експертами щодо відносин між генеративним AI та авторським правом
До цього моменту ми розглянули правові права на людський голос та дії, які можуть стати проблемою при їх використанні, на основі конкретних прикладів.
Щодо правових прав на людський голос, важливо розрізняти “зміст” та “звук” та враховувати авторське право, суміжні права та право на публічність. У цій статті ми зосередили увагу на етапі розробки та навчання як на першій частині, а в наступній частині ми розглянемо етапи генерації та використання.
Пов’язана стаття: Чи стане генерація голосу за допомогою AI порушенням авторських прав? (#2 Етап генерації та використання)[ja]
Заходи, що пропонує наша юридична фірма
Юридична фірма “Моноліт” — це фірма, яка має багатий досвід у сфері ІТ, зокрема інтернету, та права. У останні роки штучний інтелект та інтелектуальна власність, особливо авторські права, привертають все більше уваги, а потреба у юридичній перевірці постійно зростає. Наша фірма пропонує рішення, пов’язані з інтелектуальною власністю. Детальніше про це читайте у наведеній нижче статті.
Сфери діяльності юридичної фірми “Моноліт”: ІТ та інтелектуальна власність у різних компаніях[ja]
Category: IT