Onko kuvien kaapinta verkossa tekijänoikeuslain rikkomus? Selitämme koneoppimisen lailliset ongelmat
Viime vuosina tekoälyn (AI) kehitys on ollut huomattavaa, ja erilaiset AI:t, kuten kuvien luomiseen käytettävät ‘Stable Diffusion’ ja ‘Midjourney’, sekä tekstien luomiseen käytettävä ‘ChatGPT’, ovat herättäneet paljon huomiota. Verkosta kerätyn datan avulla AI:ta voidaan opettaa, mikä mahdollistaa monenlaisten toimintojen toteuttamisen AI:n avulla. Samalla kun koneoppimisen tarkkuus on parantunut, on myös huomautettu tekijänoikeuslakien rikkomisen riskeistä.
Onko verkossa julkaistujen kuvien ja muiden tietojen kerääminen ja muokkaaminen AI:n koneoppimista varten ilman lupaa tekijänoikeusrikkomus?
Tässä artikkelissa käsitellään verkossa julkaistujen kuvien ja piirrosten käyttämistä koneoppimisessa ja siihen liittyviä oikeudellisia kysymyksiä.
Mikä on koneoppiminen?
Koneoppiminen (ML: Machine Learning) tarkoittaa prosessia, jossa kone oppii datasta samalla tavalla kuin ihminen oppii kokemuksistaan. Koneoppimisen prosessissa on tarpeen kerätä dataa, valita ja jalostaa sitä, ja luoda oppimista varten tarkoitettu datasetti.
Käytännössä “crawling” tarkoittaa prosessia, jossa ohjelma, jota kutsutaan “crawleriksi”, käy läpi verkkosivustoja ja kopioi ja tallentaa verkkosivuilla olevat tekstit, kuvat ja muut tiedot.
Liittyvä artikkeli: Mikä on web scraping? Selitämme suositun datankeruumenetelmän oikeudelliset haasteet[ja]
Tekoälyyn liittyvät tekijänoikeudelliset ongelmat
“Tekijänoikeus” tarkoittaa yksinkertaisesti oikeutta, joka suojaa tekijänoikeudella suojattuja teoksia. Suojattavista “tekijänoikeudella suojatuista teoksista” määrätään Japanin tekijänoikeuslain (Japanese Copyright Law) 2 artiklan 1 kohdassa seuraavasti:
(Määritelmä)
Artikla 2: Tässä laissa seuraavien kohtien määritelmät määräytyvät kyseisten kohtien mukaan.
1. Tekijänoikeudella suojattu teos: Luova ilmaisu ajatuksista tai tunteista, jotka kuuluvat kirjallisuuden, tieteen, taiteen tai musiikin alaan.
Tekijänoikeuslain muutoksen tausta vuonna 2018 (Heisei 30)
Vuonna 2018 (Heisei 30), tekijänoikeuslakiin tehtiin muutoksia, jotka astuivat voimaan 1. tammikuuta 2019 (Heisei 31).
IoT:n, Big Datan ja tekoälyn kaltaisten teknologioiden hyödyntämiseksi on välttämätöntä mahdollistaa suuren määrän tietoa, mukaan lukien tekijänoikeudella suojatut teokset, kerääminen, yhdistäminen ja analysointi. Tästä syystä tässä muutoksessa säädetään, että tekijänoikeudella suojattujen teosten käyttö on sallittua tietyissä tapauksissa, joissa niitä ei käytetä esimerkiksi nautinnon tarkoituksiin.
Mitä käyttötapoja tekijänoikeuslain 30 artiklan 4 sallii?
Vuonna 2018 muutetun tekijänoikeuslain 30 artiklan 4 mukaan “tekijänoikeudella suojatun teoksen käyttö ilman tarkoitusta nauttia teoksessa ilmaistuista ajatuksista tai tunteista” on sallittua tarvittavassa laajuudessa, riippumatta käytetystä menetelmästä.
(Tekijänoikeudella suojatun teoksen käyttö ilman tarkoitusta nauttia teoksessa ilmaistuista ajatuksista tai tunteista)
Artikla 30, kohta 4: Tekijänoikeudella suojattua teosta voidaan käyttää seuraavissa tapauksissa tai muissa tapauksissa, joissa tarkoituksena ei ole nauttia itse tai antaa toisen nauttia teoksessa ilmaistuista ajatuksista tai tunteista, tarvittavassa laajuudessa, riippumatta käytetystä menetelmästä. Kuitenkin, jos tekijänoikeudella suojatun teoksen laji ja käyttötarkoitus sekä käytön luonne otetaan huomioon ja tekijänoikeuden haltijan etuja loukataan epäoikeudenmukaisesti, tätä ei sovelleta.
1. Tekijänoikeudella suojatun teoksen tallentamisen, tallentamisen tai muun käytön teknologian kehittämiseen tai käytännön soveltamiseen tarvittavat kokeet
2. Tietojen analysointi (suuren määrän tekijänoikeudella suojattuja teoksia tai muita tietoja sisältävien tietojen kielellisten, äänellisten, kuvallisten tai muiden elementtien tietojen poimiminen, vertailu, luokittelu tai muu analysointi. Sama koskee 47 artiklan 5 kohdan 1 alakohdan 2 kohtaa.)
3. Tekijänoikeudella suojatun teoksen käyttö tietokoneen tietojenkäsittelyprosessissa tai muussa käytössä (ohjelmistoteoksissa lukuun ottamatta ohjelmistoteoksen suorittamista tietokoneessa) ilman ihmisen havaitsemista teoksen ilmaisusta
Käytännössä seuraavissa tapauksissa tekijänoikeudella suojatun teoksen käyttö on sallittua:
・Taide-esineiden kopioimiseen soveltuvien kameroiden tai tulostimien kehittämiseksi taide-esineitä kopioidaan kokeellisesti
・Tekoälyn kehittämiseksi kerätään tekijänoikeudella suojattuja teoksia oppimisdatana ja niitä käytetään tai niitä tarjotaan kolmansille osapuolille tekoälyn kehittämisen tarkoituksessa (esim. luovutus tai julkiset lähetykset)
・Tietokoneen tietojenkäsittelyprosessissa tekijänoikeudella suojattu teos kopioidaan taustalla ja sen tietoja käytetään ilman, että ihminen havaitsee sitä lainkaan
・Ohjelmistoteoksen käyttö ohjelman tutkimus- ja analysointitarkoituksessa (ns. “reverse engineering”)
Lähde: Japanin kulttuurivirasto | Tekijänoikeuslain muutos (Heisei 30:n laki nro 30)[ja]
Tapaukset, joissa koneoppimisen käyttö tekijänoikeuden alaisissa teoksissa voi rikkoa tekijänoikeuslakia
Kuten tiedämme, kuvien (tekijänoikeuden alaisten teosten) kerääminen, muokkaaminen ja käyttäminen koneoppimista varten, sekä kerättyjen opetusdatan tarjoaminen kolmansille osapuolille (myynti, siirto jne.) on sallittu Japanin tekijänoikeuslain (Japanese Copyright Law) 30 §:n 4 momentin 2 kohdan mukaan. Kuitenkin, tällainen tekijänoikeuden alaisten teosten käyttö voi johtaa oikeudellisiin ongelmiin.
Tässä tarkastelemme oikeudellisia ongelmia, jotka voivat syntyä, kun kerätään internetissä julkaistuja kuvia koneoppimista varten.
Liittyvä artikkeli: Kuinka paljon internetissä olevaa tietoa voi käyttää? Selitys internetin tekijänoikeuksista[ja]
Tapaukset, joissa tekijänoikeuden haltijan etuja loukataan epäoikeudenmukaisesti
Japanin tekijänoikeuslain 30 §:n 4 momentissa, vaikka se sallii “käytön, joka ei tähtää teoksessa ilmaistujen ajatusten tai tunteiden nauttimiseen”, se ei salli teoksen käyttöä, jos se vahingoittaa tekijänoikeuden haltijan etuja epäoikeudenmukaisesti.
Mitä tapauksia voidaan konkreettisesti ajatella? Japanin kulttuuriviraston (Japanese Agency for Cultural Affairs) Q&A:n mukaan seuraavat tapaukset voivat kuulua “tapauksiin, joissa tekijänoikeuden haltijan etuja loukataan epäoikeudenmukaisesti”.
Viime kädessä tuomioistuin tekee konkreettisen päätöksen, mutta esimerkiksi, jos tietokanta, joka on järjestetty helposti tietoanalyysiin käytettäväksi ja joka sisältää suuren määrän tietoa, myydään, sen tietokannan kopiointi tai vastaava toiminta tietoanalyysitarkoituksessa voi olla ristiriidassa kyseisen tietokannan myyntimarkkinoiden kanssa ja siten kuulua “tapauksiin, joissa tekijänoikeuden haltijan etuja loukataan epäoikeudenmukaisesti”.
Lähde: Japanin kulttuuriviraston tekijänoikeusosasto | “Perusajatukset joustavista oikeuksien rajoituksista vastauksena digitalisaation ja verkottumisen edistymiseen”[ja]
Tapaukset, joissa on tehty sopimus, joka poikkeaa tekijänoikeuslain säännöksistä
Vaikka Japanin tekijänoikeuslaki sallii tekijänoikeuden alaisten teosten käytön koneoppimisessa, osapuolet voivat sopia toisin. Jos tällainen sopimus on tehty, sopimuksen rikkominen voi johtaa vahingonkorvausvastuuseen.
Esimerkiksi, jotkin sivustot saattavat nimenomaisesti kieltää koneoppimisen ja tietoanalyysin tarkoituksessa tehtävän datan keräämisen ja poiminnan käyttöehdoissaan tai lisenssiehdoissaan. Kun keräät dataa, sinun on tarkistettava kyseisen sivuston käyttöehdot ja lisenssiehdot.
Yleisesti ottaen, “sopimuksen” tekemiseksi sivuston käyttöehdoissa vaaditaan jonkinlainen toiminta. Esimerkiksi, “tilin luomalla hyväksyt käyttöehdot ja tietosuojakäytännön” tai vastaava ilmoitus, jossa vaaditaan rekisteröitymistä tai suostumuspainikkeen painamista. “Sopimus” syntyy, kun rekisteröidyt tai painat suostumuspainiketta.
Toisaalta, jos sivusto on asettanut käyttöehdot, jotka kieltävät datan keräämisen ja poiminnan, erilliselle sivulle kuin kuvien lataussivulle, ja kuvien lataaminen on mahdollista ilman, että suostut niihin, “sopimusta” ei ole tehty. Tässä tapauksessa tekijänoikeuslain säännökset soveltuvat, ja voit käyttää tekijänoikeuden alaista teosta.
Kuitenkin, välttääksesi ongelmia, on suositeltavaa välttää datan keräämistä sivustoilta, jotka nimenomaisesti kieltävät datan keräämisen ja poiminnan käyttöehdoissaan.
Liittyvä artikkeli: Mikä on web scraping? Selitys suositun datankeruumenetelmän oikeudellisista haasteista[ja]
Rikkooko koneoppimisella tuotettu kuva tekijänoikeuslakia?
Olemme tähän asti selittäneet, että tekijänoikeuslaki sallii teosten käytön koneoppimisessa. Mutta rikkooko AI, joka suorittaa koneoppimista ja luo synteettisiä kuvia, alkuperäisten opetuskuviensa (valokuvat, kuvitukset, maalaukset jne.) tekijänoikeuksia?
Tässä selitämme esimerkin avulla tapauksen, jossa AI luo kuvia käyttäen GAN:ia (Generative Adversarial Networks, suomeksi generatiiviset vastustajaverkostot).
Koneoppimisen avulla tuotettujen kuvien toimintaperiaate
GAN (Generative Adversarial Networks, generatiiviset vastustajaverkostot) on eräänlainen generatiivinen malli, joka voi oppia piirteitä datasta ja luoda olemattomia tietoja tai muuntaa olemassa olevia tietoja niiden ominaisuuksien mukaisesti. Tätä GAN:in kuvien luomisen periaatetta käytetään esimerkiksi palveluissa, jotka analysoivat todellisten huoneiden valokuvia tai piirroksia ja luovat kuvia, jotka näyttävät siltä kuin huonekalut olisivat todella paikallaan budjetin tai huoneen koon mukaan.
Voiko AI rikkoa koneoppimisen alkuperäisten kuvien tekijänoikeuksia?
GAN koostuu kahdesta neuroverkosta, generaattorista (Generator) ja diskriminaattorista (Discriminator). Näistä generaattori numerisoi alkuperäisen kuvan ominaisuudet ja luo synteettisen kuvan tuottamalla numerot, jotka on säädettävä tietyn muuttujan mukaan, joka syötetään siihen.
Toisin sanoen, synteettinen kuva on uusi kuva, joka on luotu syöttämällä muuttuja funktioon synteesiprosessin aikana, joten se on täysin erilainen kuin alkuperäinen kuva (valokuvat, kuvitukset, maalaukset jne.). Vaikka koneoppimisen tuloksena syntyisi kuva, joka muistuttaa alkuperäistä kuvaa, sitä ei pidetä alkuperäisen opetusdatan kopiona, käännöksenä tai muunnelmana.
Siksi voidaan sanoa, että AI:n koneoppimisella luomat synteettiset kuvat eivät riko alkuperäisten opetuskuvien tekijänoikeuksia.
Liittyvä artikkeli: Miten immateriaalioikeudet suojataan AI-kehityksessä? Tekijänoikeus, patenttioikeus – keskustelun aiheet[ja]
Yhteenveto: Konsultoi lakimiestä AI:n koneoppimisen ja tekijänoikeuksien kysymyksissä
Tässä artikkelissa olemme käsitelleet tekijänoikeuslainsäädännön ongelmia, jotka liittyvät internetissä julkaistujen kuvien käyttöön AI:n koneoppimisessa.
Tekijänoikeudellisten teosten käyttö koneoppimisessa on sallittua Japanin tekijänoikeuslain (Tekijänoikeuslaki, 30.4 pykälä) mukaan. Kuitenkin poikkeuksellisesti, jos tekijänoikeuden haltijan etuja loukataan epäoikeudenmukaisesti tai jos osapuolet ovat sopineet tekijänoikeuslain säännöksistä poikkeavasti, teoksen käyttö ei välttämättä ole sallittua.
AI-teknologiat, kuten “Midjourney”, “Stable Diffusion” ja “ChatGPT”, ovat herättäneet huomiota, ja yhä useammat yritykset ryhtyvät kehittämään AI:ta. Koska tekijänoikeudellisten teosten käyttö oppimisdatana AI-kehityksessä voi olla vaikea arvioida, suosittelemme konsultoimaan IT-alan asiantuntevaa lakimiestä, jos aiotte hyödyntää AI:ta tai koneoppimista liiketoiminnassanne.
Toimenpiteet toimistossamme
Monolith Lakitoimisto on lakitoimisto, jolla on laaja kokemus IT:stä, erityisesti internetistä ja laista.
AI-liiketoimintaan liittyy monia oikeudellisia riskejä, ja AI:hin liittyvissä oikeudellisissa kysymyksissä tarvitaan asianajajien tukea, jotka ovat perehtyneet AI:hin. Toimistossamme on tiimi, joka koostuu AI:hin perehtyneistä asianajajista ja insinööreistä, ja tarjoamme korkeatasoista oikeudellista tukea AI-liiketoiminnalle, mukaan lukien ChatGPT, kuten sopimusten laatiminen, liiketoimintamallin laillisuuden tarkastelu, immateriaalioikeuksien suojaaminen ja yksityisyyden suojaaminen. Yksityiskohtia on kuvattu alla olevassa artikkelissa.
Monolith Lakitoimiston käsittelemät alueet: AI (ChatGPT jne.) lakiasiat[ja]
Category: IT