Porušuje procházení obrázků na internetu autorské právo? Vysvětlení právních problémů strojového učení
V posledních letech je pokrok v technologii AI (umělé inteligence) pozoruhodný a různé AI, jako jsou generátory obrázků jako “Stable Diffusion” nebo “Midjourney”, nebo generátory textů jako “ChatGPT”, přitahují pozornost. Díky využití AI pro učení se z dat získaných z internetu se stává možným provádět různé úkony a přesnost strojového učení se zlepšuje. Na druhé straně je upozorňováno na riziko porušení autorských práv.
Je možné, že sběr a zpracování různých dat, jako jsou obrázky nebo ilustrace zveřejněné na internetu, bez povolení a jejich využití pro strojové učení AI, neporušuje autorská práva?
V tomto článku vysvětlíme právní problémy spojené s využitím obrázků a ilustrací zveřejněných na internetu pro strojové učení.
Co je strojové učení
Strojové učení (ML: Machine Learning) je proces, kdy se stroje učí z dat stejně jako lidé se učí z zkušeností. V procesu strojového učení je nutné shromažďovat data, vybírat a zpracovávat tato data a vytvářet sady dat pro učení.
Crawling je proces, kdy program nazývaný crawler prochází webové stránky a kopíruje a ukládá informace, jako jsou texty a obrázky, které se na webových stránkách nacházejí.
Související článek: Co je scraping? Vysvětlujeme právní problémy oblíbené metody sběru dat[ja]
Problémy týkající se autorských práv v oblasti strojového učení
“Autorská práva” jsou práva, která chrání díla z právního hlediska. A co je chráněno jako “dílo”, je definováno v článku 2 odstavec 1 Japonského zákona o autorských právech (Japonský zákon o autorských právech) následovně:
(Definice)
Článek 2 V tomto zákoně mají výrazy uvedené v následujících položkách význam stanovený v příslušných položkách.
1. Dílo: Výraz kreativních myšlenek nebo emocí, které patří do oblasti literatury, vědy, umění nebo hudby.
Pozadí změny zákona o autorských právech v roce 2018 (Heisei 30)
V roce 2018 (Heisei 30), byl změněn zákon o autorských právech a začal platit od 1. ledna 2019 (Heisei 31).
Pro využití technologií jako jsou IoT, Big Data a AI (umělá inteligence) je nutné umožnit akumulaci, kombinaci a analýzu velkého množství informací, včetně děl. Proto byla v této změně stanovena ustanovení, která umožňují využití děl za určitých okolností, jako je například nevyužití děl pro účely apreciace.
Jaké jsou povolené způsoby využití podle článku 30 odstavec 4 zákona o autorských právech?
V článku 30 odstavec 4 zákona o autorských právech, který byl změněn v roce 2018, je nyní povoleno využití děl “bez účelu vychutnávání myšlenek nebo emocí vyjádřených v díle” v rozsahu, který je považován za nezbytný, bez ohledu na metodu.
(Využití bez účelu vychutnávání myšlenek nebo emocí vyjádřených v díle)
Článek 30 odstavec 4 Díla mohou být využita jakýmkoli způsobem v rozsahu, který je považován za nezbytný, pokud nejsou určena k vlastnímu nebo cizímu vychutnání myšlenek nebo emocí vyjádřených v daném díle, s výjimkou případů, kdy by toto využití nespravedlivě poškodilo zájmy autora vzhledem k typu a účelu daného díla a způsobu jeho využití.
1. Využití pro testování vývoje nebo praktického využití technologií souvisejících s nahráváním, záznamem nebo jiným využitím děl
2. Využití pro analýzu informací (extrakce informací týkajících se jazyka, zvuku, obrazu a jiných prvků, které tvoří dané informace z mnoha děl a jiných velkých množství informací, a provádění porovnání, klasifikace a jiných analýz. Stejný význam má v článku 47 odstavec 5 položka 1 položka 2.)
3. Využití díla v procesu zpracování informací pomocí počítače nebo jiného využití (s výjimkou provádění díla programu na počítači), aniž by to zahrnovalo vnímání vyjádření díla člověkem, kromě případů uvedených v předchozích dvou položkách
Konkrétně jsou povoleny následující případy využití děl:
・Činnost testování reprodukce uměleckých děl za účelem vývoje kamer nebo tiskáren vhodných pro reprodukci uměleckých děl
・Činnost shromažďování a využívání děl jako tréninkových dat pro vývoj umělé inteligence nebo poskytování shromážděných tréninkových dat třetím stranám za účelem vývoje umělé inteligence (převod nebo veřejné přenosy atd.)
・Činnost kopírování děl v backendu počítačového zpracování informací a využívání těchto dat bez jakéhokoli vnímání člověkem
・Činnost využívání děl programu za účelem vyšetřování a analýzy programu (tzv. “reverse engineering”)
Citace: Agentura pro kulturu|O zákonu o změně části zákona o autorských právech (Zákon Heisei 30 č. 30)[ja]
Případy, kdy použití děl pro strojové učení může porušit autorské právo
Je samozřejmě možné sbírat, zpracovávat a využívat obrázky (díla) pro strojové učení, stejně jako poskytovat shromážděná data pro učení třetím stranám (prodej, převod atd.). To je povoleno podle článku 30 odst. 4 č. 2 japonského zákona o autorských právech. Nicméně, takové využití děl může vést k právním problémům.
Zde se podíváme na právní problémy, které mohou nastat při sběru obrázků zveřejněných na internetu a jejich využití pro strojové učení.
Související článek: Do jaké míry lze využívat informace na internetu? Vysvětlení autorských práv na internetu[ja]
Pokud je poškozen zájem držitele autorských práv
Podle článku 30 odst. 4 japonského zákona o autorských právech je povoleno “využití, které nemá za cíl vychutnávat si myšlenky nebo emoce vyjádřené v díle”, ale pokud takové využití neoprávněně poškodí zájmy držitele autorských práv, využití díla není povoleno.
Jaké konkrétní případy lze představit? Podle Q&A Agentury pro kulturu Japonska se následující případy považují za “případy, kdy je poškozen zájem držitele autorských práv”.
Konkrétní rozhodnutí je nakonec učiněno na soudním jednání, ale například pokud je dílo databáze, které je uspořádáno tak, aby bylo snadno využitelné pro analýzu velkého množství informací, prodáváno, pak se považuje za “případ, kdy je poškozen zájem držitele autorských práv”, pokud je tato databáze kopírována atd. pro účely analýzy informací, což by bylo v rozporu s trhem pro prodej této databáze.
Citace: Oddělení autorských práv Agentury pro kulturu Japonska | “Základní myšlenky týkající se flexibilních omezení práv v reakci na pokrok v digitalizaci a sítích”[ja]
Pokud byla dohodnuta dohoda odlišná od ustanovení autorského zákona
Japonský zákon o autorských právech povoluje využití děl pro strojové učení, ale strany mohou dohodnout něco jiného. Pokud byla taková dohoda uzavřena, může být možné uplatnit odpovědnost za náhradu škody atd., pokud je dohoda porušena.
Například, některé webové stránky mohou v podmínkách použití nebo licenčních podmínkách explicitně zakazovat sběr nebo extrakci dat pro strojové učení nebo analýzu informací. Při sběru dat je třeba zkontrolovat podmínky použití a licenční podmínky těchto stránek.
Obecně platí, že pro “souhlas” s podmínkami použití stránky je vyžadována nějaká akce. Například, může být požadováno, aby jste vytvořili účet nebo stiskli tlačítko souhlasu spolu s prohlášením, že “tím, že vytvoříte účet, souhlasíte s podmínkami použití a zásadami ochrany osobních údajů”. “Souhlas” je uzavřen kliknutím na tlačítko registrace nebo souhlasu.
Na druhou stranu, pokud jsou podmínky použití, které zakazují sběr nebo extrakci dat, zveřejněny na stránce, která je odlišná od stránky pro stahování, a je možné stáhnout obrázky bez souhlasu s těmito podmínkami, “souhlas” není uzavřen. V tomto případě se uplatňují ustanovení autorského zákona a je možné využívat díla.
Přesto je lepší se vyhnout sběru dat ze stránek, které v podmínkách použití explicitně zakazují sběr nebo extrakci dat, aby se předešlo problémům.
Související článek: Co je to scraping? Vysvětlení právních problémů s tímto populárním způsobem sběru dat[ja]
Porušuje obrázky vytvořené pomocí strojového učení autorské právo?
Dosud jsme vysvětlili, že použití děl pro strojové učení je uznáno v rámci autorského práva. Ale stává se porušením autorských práv původních obrázků (fotografií, ilustrací, malířství atd.), které sloužily jako základ pro učení, když AI provádí strojové učení a vytváří syntetické obrázky?
Zde vysvětlíme případ, kdy AI provádí generování obrázků pomocí GAN (Generative Adversarial Networks).
Jak funguje generování obrázků pomocí strojového učení
GAN (Generative Adversarial Networks) je typ generativního modelu, který může generovat neexistující data nebo transformovat existující data podle jejich vlastností tím, že se učí z dat. Tento mechanismus generování obrázků pomocí GAN se například používá v službách, které analyzují fotografie nebo kresby skutečných místností a syntetizují obrázky tak, jako by nábytek odpovídající rozpočtu nebo velikosti místnosti byl skutečně umístěn tam.
Může AI porušit autorská práva původních obrázků, které se naučila?
GAN se skládá ze dvou neuronových sítí, generátoru (Generator) a diskriminátoru (Discriminator). Z nich generátor číselně čte vlastnosti původního obrázku a vstupuje do něj určitou proměnnou, aby vygeneroval syntetický obrázek vydávající čísla upravená touto proměnnou.
Jinými slovy, syntetický obrázek je zcela nový obrázek vytvořený jako výsledek vstupu proměnné do funkce během procesu syntézy, takže je zcela odlišný od původních dat obrázku (fotografie, ilustrace, malby atd.). Dokonce i když je výsledkem strojového učení vytvořen obrázek podobný původnímu, nepovažuje se to za kopírování, adaptaci nebo úpravu původních dat pro učení.
Proto lze říci, že syntetické obrázky vytvořené AI pomocí strojového učení neporušují autorská práva původních obrázků použitých pro učení.
Související článek: Jak jsou chráněna duševní práva při vývoji AI? Organizace autorských práv a patentových práv[ja]
Shrnutí: Problémy s autorskými právy a strojovým učením AI – konzultujte s právníkem
V tomto článku jsme se zabývali problémy autorských práv spojených s využitím obrázků zveřejněných na internetu pro strojové učení AI.
Využití autorských děl pro strojové učení je povoleno podle autorského zákona (paragraf 30 odstavec 4 Japonského autorského zákona). Nicméně, existují výjimky, kdy využití autorských děl není povoleno, například pokud by to nespravedlivě poškodilo zájmy držitele autorských práv, nebo pokud by strany uzavřely dohodu, která je v rozporu s ustanoveními autorského zákona.
AI jako “Midjourney”, “Stable Diffusion” nebo “ChatGPT” přitahuje pozornost a počet společností, které se pustily do dalšího vývoje AI, rychle roste. Otázka, zda je povoleno využívat autorská díla jako nezbytná učební data pro vývoj AI, může být někdy těžká na rozhodnutí. Proto doporučujeme konzultovat s právníkem, který je odborníkem v oblasti IT, pokud plánujete podnikat v oblasti využití AI a strojového učení.
Představení opatření naší kanceláře
Právní kancelář Monolith je právní kancelář s bohatými zkušenostmi v oblasti IT, zejména internetu a práva.
Obchod s AI přináší mnoho právních rizik a je nezbytné mít podporu právníků, kteří jsou dobře obeznámeni s právními problémy týkajícími se AI. Náš tým, složený z právníků a inženýrů dobře obeznámených s AI, poskytuje pokročilou právní podporu pro obchod s AI, včetně ChatGPT, jako je tvorba smluv, posuzování legality obchodních modelů, ochrana duševního vlastnictví a zajištění soukromí. Podrobnosti jsou uvedeny v následujícím článku.
Obory, kterými se zabývá právní kancelář Monolith: Právo AI (ChatGPT atd.)[ja]
Category: IT