Kas piltide indekseerimine internetis on autoriõiguse seaduse rikkumine? Masinõppe õiguslikud probleemid selgitatud
Viimastel aastatel on AI (kunstliku intelligentsuse) tehnoloogia areng olnud märkimisväärne ning erinevad AI-d, nagu pildigeneraatorid “Stable Diffusion” ja “Midjourney” ning teksti genereeriv “ChatGPT”, on saanud palju tähelepanu. Internetist andmete kogumine ja AI õpetamine on muutnud võimalikuks erinevate asjade tegemise AI abil ning kuigi masinõppe täpsus on paranenud, on tõstatatud ka autoriõiguse rikkumise riski küsimus.
Kas internetis avaldatud piltide, illustratsioonide ja muude andmete kogumine ilma loata, nende töötlemine ja kasutamine AI masinõppe jaoks ei riku autoriõigusi?
Selles artiklis selgitame õiguslikke probleeme, mis on seotud internetis avaldatud piltide ja illustratsioonide kasutamisega masinõppes.
Mis on masinõpe
Masinõpe (ML: Machine Learning) on protsess, kus masin õpib andmetest samamoodi nagu inimene õpib kogemustest. Masinõppe protsessis on vaja koguda andmeid, valida ja töödelda neid andmeid ning luua õppeandmete komplekt.
Küürimine tähendab, et programm, mida nimetatakse küürimisrobotiks, külastab veebisaite, kopeerib ja salvestab veebilehtedel olevat teavet, nagu tekst ja pildid.
Seotud artikkel: Mis on andmete kogumine? Seaduslikud probleemid populaarse andmete kogumise meetodi selgitamisel[ja]
Probleemid autoriõigusega masinõppes
“Autoriõigus” on lihtsustatult öeldes õigus, mis kaitseb õiguslikult teoseid. Ja “teosed”, mida kaitstakse, on määratletud Jaapani autoriõiguse seaduse (Japanese Copyright Law) paragrahvi 2 lõike 1 alusel järgmiselt:
(Määratlus)
Paragrahv 2. Selle seaduse raames on järgnevalt loetletud terminite tähendused määratletud vastavalt nendes punktides sätestatule.
1. Teos – loominguline väljendus mõtetest või tunnetest, mis kuuluvad kirjanduse, teaduse, kunsti või muusika valdkonda.
2018. aasta (Heisei 30) autoriõiguse seaduse muudatuste taust
2018. aastal (Heisei 30), muudetud autoriõiguse seadus jõustus ja hakkas kehtima 2019. aasta (Heisei 31) 1. jaanuarist.
IoT, suurandmed, AI (kunstlik intelligents) ja muude tehnoloogiate kasutamiseks on vaja võimaldada teoste hulka kuuluva suure hulga teabe kogumist, kombineerimist, analüüsi jne. Seetõttu on selles muudatuses sätestatud, et teoste kasutamine on lubatud teatud tingimustel, näiteks kui teoseid ei kasutata nautimise eesmärgil.
Mis on paragrahvi 30 lõike 4 alusel lubatud kasutusviisid?
2018. aastal muudetud autoriõiguse seaduse paragrahvi 30 lõige 4 võimaldab “teose kasutamist ilma teoses väljendatud mõtteid või tundeid nautimata” vajalikus ulatuses, olenemata meetodist.
(Teose kasutamine ilma teoses väljendatud mõtteid või tundeid nautimata)
Paragrahv 30 lõige 4. Teost võib kasutada järgmistel juhtudel või muudel juhtudel, kui teose kasutamise eesmärk ei ole nautida teoses väljendatud mõtteid või tundeid ise või lasta teistel neid nautida, vajalikus ulatuses, olenemata meetodist. Siiski, kui teose liik ja kasutus ning kasutamise viis võivad autoriõiguse omaniku huve ebaõiglaselt kahjustada, siis see ei kehti.
1. Teose kasutamine helisalvestuse, videosalvestuse või muu kasutamise tehnoloogia arendamiseks või praktiliseks rakendamiseks katsete eesmärgil
2. Teabe analüüsimine (teabe ekstraheerimine keele, heli, piltide või muude elementide kohta, mis moodustavad suure hulga teoseid või muud suurt hulka teavet, ning nende võrdlemine, klassifitseerimine või muu analüüs. Sama kehtib paragrahvi 47 lõike 5 punkti 1 alapunkti 2 kohta.)
3. Teose kasutamine elektroonilise arvuti teabe töötlemise protsessis või muul viisil ilma inimese tajumiseta teose väljenduse suhtes (programmi teose puhul ei hõlma see teose täitmist elektroonilises arvutis).
Konkreetselt on teose kasutamine lubatud järgmistel juhtudel:
・Kunstiteose reprodutseerimiseks sobiva kaamera või printeri arendamiseks kunstiteose katsetamiseks reprodutseerimine
・Teose kogumine õppeandmetena AI arendamiseks, õppeandmete kogumine AI arendamise eesmärgil ja nende andmete pakkumine kolmandatele isikutele (üleandmine või avalik edastamine jne)
・Teose kopeerimine arvuti teabe töötlemise protsessis taustal ja selle andmete kasutamine ilma, et inimene seda tajuks
・Programmi teose kasutamine programmi uurimiseks ja analüüsimiseks (nn “tagurpidi inseneritöö”)
Viide: Kultuuriamet | Autoriõiguse seaduse muudatus (Heisei 30. aasta seadus nr 30) kohta[ja]
Juhtumid, kus masinõppe kasutamine autoriõigusega kaitstud teoste puhul võib rikkuda autoriõiguse seadust
Nagu näha, on piltide (autoriõigusega kaitstud teoste) kogumine, töötlemine ja kasutamine masinõppe eesmärgil, samuti kogutud õppeandmete kolmandatele isikutele pakkumine (müük, üleandmine jne) lubatud Jaapani autoriõiguse seaduse (Japanese Copyright Law) paragrahvi 30 lõike 4 punkti 2 alusel. Siiski võib selline autoriõigusega kaitstud teoste kasutamine põhjustada õiguslikke probleeme.
Vaatleme siin võimalikke õiguslikke probleeme, mis võivad tekkida, kui kasutate masinõppimiseks internetis avaldatud pilte.
Seotud artikkel: Kui palju saab internetis olevat teavet kasutada? Selgitame interneti autoriõigusi[ja]
Kui kahjustatakse ebaõiglaselt autoriõiguse omaniku huve
Jaapani autoriõiguse seaduse paragrahvi 30 lõikes 4 lubatakse “kasutamine, mis ei ole suunatud autoriõigusega kaitstud teoses väljendatud mõtete või tunnete nautimisele”, kuid see ei luba autoriõigusega kaitstud teoste kasutamist, kui see kahjustab ebaõiglaselt autoriõiguse omaniku huve.
Mis tüüpi juhtumeid võiks konkreetselt ette tulla? Kultuuriameti (Japanese Agency for Cultural Affairs) Q&A kohaselt on järgmised juhtumid need, mis vastavad “autoriõiguse omaniku huvide ebaõiglasele kahjustamisele”.
Kuigi konkreetne otsus tehakse lõpuks kohtus, võib näiteks andmebaasi, mis on korraldatud selliselt, et suurt hulka teavet saab hõlpsasti kasutada teabe analüüsimiseks, ja mida müüakse, kopeerimine või muu selline tegevus teabe analüüsimise eesmärgil olla vastuolus andmebaasi müügiga seotud turuga ja seega vastata “autoriõiguse omaniku huvide ebaõiglasele kahjustamisele”.
Viide: Kultuuriameti autoriõiguse osakond | “Põhimõtted paindlike õiguste piirangute kohta, mis vastavad digiteerimise ja võrgustumise edenemisele”[ja]
Kui on sõlmitud autoriõiguse seadusest erinev kokkulepe
Autoriõiguse seadus lubab autoriõigusega kaitstud teoste kasutamist masinõppes, kuid pooled võivad sõlmida ka sellest erineva kokkuleppe. Kui selline kokkulepe on sõlmitud, võib kokkuleppe rikkumise korral nõuda kahju hüvitamist.
Näiteks on olemas saite, mis keelavad oma kasutustingimustes või litsentsitingimustes masinõppe või teabe analüüsi eesmärgil andmete kogumise või väljavõtmise. Andmete kogumisel peate kontrollima selle saidi kasutustingimusi või litsentsitingimusi.
Üldiselt nõutakse saidi kasutustingimustega “nõustumiseks” mingit toimingut. Näiteks võidakse nõuda registreerimist või nõusoleku nupu vajutamist koos teatega, et “konto loomisega nõustute kasutustingimuste ja privaatsuspoliitikaga”. Registreerimise või nõusoleku nupu klõpsamisega “nõustute”.
Teisest küljest, kui lihtsalt andmete kogumise või väljavõtmise keelavaid kasutustingimusi kuvatakse saidil eraldi lehel ja pilte saab alla laadida ka ilma nõusolekuta, siis “nõusolekut” ei ole sõlmitud. Sellisel juhul kohaldatakse autoriõiguse seaduse sätteid ja autoriõigusega kaitstud teoseid saab kasutada.
Siiski, et vältida probleeme, on parem hoiduda andmete kogumisest saitidelt, mis keelavad kasutustingimustes selgesõnaliselt andmete kogumise või väljavõtmise.
Seotud artikkel: Mis on veebi kraapimine? Selgitame populaarse andmete kogumise meetodi õiguslikke probleeme[ja]
Kas masinõppe abil loodud pildid rikuvad autoriõiguse seadust?
Oleme seni selgitanud, et autoriõiguse seaduse kohaselt on lubatud kasutada teoseid masinõppes. Kuid kas AI poolt masinõppe abil loodud sünteetilised pildid rikuvad õppeprotsessi aluseks olnud piltide (fotod, illustratsioonid, maalid jne) autoriõigusi?
Selles artiklis selgitame seda GAN-i (Generative Adversarial Networks – generatiivsete vastanduvate võrkude) abil loodud piltide näitel.
Masinõppe abil piltide loomise mehhanism
GAN (Generative Adversarial Networks) on üks generatiivsete mudelite tüüp, mis suudab õppida andmete omadusi ja luua olemasolevaid andmeid või muuta olemasolevaid andmeid nende omaduste järgi. Seda GAN-i abil piltide loomise mehhanismi kasutatakse näiteks teenustes, mis analüüsivad tegelike tubade fotosid või pilte ja loovad kujutisi, justkui oleksid mööbel paigutatud vastavalt eelarvele ja toa suurusele.
Kas AI võib rikkuda masinõppe aluseks olnud piltide autoriõigusi?
GAN koosneb kahest närvivõrgust: generaatorist (Generator) ja diskriminaatorist (Discriminator). Neist esimene, generaator, loeb algpildi omadused numbriliselt ja sisestab teatud muutujad, et luua sünteetiline pilt, mis on kohandatud nende muutujate järgi.
Seega, sünteetilised pildid on uued pildid, mis on loodud funktsiooni sisestamise tulemusena sünteesiprotsessi käigus, ja neid võib pidada täiesti erinevateks algsetest piltidest (fotod, illustratsioonid, maalid jne). Isegi kui masinõppe tulemusena luuakse pilt, mis sarnaneb algse pildiga, ei peeta seda algse õppematerjali kopeerimiseks, tõlkimiseks ega muutmiseks.
Seega, AI poolt masinõppe abil loodud sünteetilised pildid ei riku masinõppe aluseks olnud piltide autoriõigusi.
Seotud artikkel: Kuidas kaitstakse intellektuaalomandi õigusi AI arendamisel? Autoriõiguse ja patendiõiguse küsimuste käsitlemine[ja]
Kokkuvõte: Konsulteerige advokaadiga AI masinõppe ja autoriõiguse küsimustes
Selles artiklis selgitasime autoriõiguse probleeme, mis tekivad siis, kui kasutate internetis avaldatud pilte AI masinõppes.
Teoste kasutamine masinõppes on lubatud autoriõiguse seaduse alusel (Jaapani autoriõiguse seaduse paragrahv 30-4). Siiski on erandeid, näiteks juhul, kui see kahjustab ebaõiglaselt autoriõiguste omaniku huve või kui pooled on kokku leppinud midagi, mis erineb autoriõiguse seaduse sätetest, võib teoste kasutamine olla lubamatu.
AI-d nagu “Midjourney”, “Stable Diffusion” ja “ChatGPT” on saanud palju tähelepanu ja ettevõtteid, kes soovivad alustada AI arendamist, on järjest rohkem. Kas teoste kasutamine õppeandmetena on lubatud või mitte, võib olla keeruline otsustada, seega soovitame konsulteerida IT-valdkonna advokaadiga, kui tegelete AI ja masinõppe kasutamisega äritegevuses.
Meie büroo poolt pakutavad meetmed
Monolithi õigusbüroo on õigusbüroo, millel on rikkalik kogemus IT-s, eriti interneti ja õiguse valdkonnas.
AI-äri on seotud paljude õiguslike riskidega ja AI-ga seotud õigusküsimustes on hädavajalik advokaadi tugi, kes on AI-s hästi kursis. Meie büroo pakub AI-äri, sealhulgas ChatGPT, jaoks kõrgelt kvalifitseeritud õiguslikku tuge, sealhulgas lepingute koostamine, ärimudeli seaduslikkuse hindamine, intellektuaalomandi kaitse, privaatsusega seotud küsimused jne, meeskonnaga, mis koosneb AI-ga hästi kursis olevatest advokaatidest ja inseneridest. Üksikasjad on kirjeldatud allpool toodud artiklis.
Monolithi õigusbüroo tegevusvaldkonnad: AI (ChatGPT jne) õigus[ja]
Category: IT