MONOLITH LAW OFFICE+81-3-6262-3248Vardagar 10:00-18:00 JST [English Only]

MONOLITH LAW MAGAZINE

IT

Är bildskrapning på nätet ett brott mot upphovsrättslagen? En förklaring av juridiska problem med maskininlärning

IT

Är bildskrapning på nätet ett brott mot upphovsrättslagen? En förklaring av juridiska problem med maskininlärning

På senare år har framstegen inom AI (Artificiell Intelligens) varit anmärkningsvärda, och olika AI som bildgenererande AI som “Stable Diffusion” och “Midjourney”, samt textgenererande AI som “ChatGPT”, har fått mycket uppmärksamhet. Genom att crawla data på nätet och låta AI lära av det, blir det möjligt att använda AI för olika ändamål. Samtidigt som noggrannheten i maskininlärning förbättras, pekas riskerna för brott mot upphovsrättslagen ut.

Är det inte en kränkning av upphovsrätten att crawla och samla in olika data som bilder och illustrationer som publiceras på nätet utan tillstånd, bearbeta dem och använda dem för AI:s maskininlärning?

I den här artikeln kommer vi att diskutera de juridiska problemen med att använda bilder och illustrationer som publiceras på nätet för maskininlärning.

Vad är maskininlärning?

Vad är maskininlärning

Maskininlärning (ML: Machine Learning) innebär att maskiner lär sig från data på samma sätt som människor lär sig från erfarenheter. I processen för maskininlärning behöver man samla in data, välja och bearbeta den, och skapa en datamängd för inlärning.

Crawling innebär att ett program som kallas en crawler går igenom webbplatser och kopierar och sparar information som text och bilder som finns på webbsidor.

Relaterad artikel: Vad är skrapning? En förklaring av de juridiska frågorna med denna populära datainsamlingsmetod[ja]

Problem med upphovsrättslag i maskininlärning

“Upphovsrätt” är, enkelt uttryckt, en rättighet som juridiskt skyddar verk. Och de “verk” som skyddas definieras i artikel 2, paragraf 1 i den japanska upphovsrättslagen (Japanska Upphovsrättslagen) på följande sätt:

(Definition)

Artikel 2 I denna lag är betydelsen av de termer som anges i följande punkter som fastställts i respektive punkt.

1. Verk: Detta avser något som kreativt uttrycker tankar eller känslor och som tillhör området för litteratur, vetenskap, konst eller musik.

Bakgrunden till ändringen av upphovsrättslagen 2018 (Heisei 30)

År 2018 (Heisei 30), ändrades den japanska upphovsrättslagen och trädde i kraft den 1 januari 2019 (Heisei 31).

För att utnyttja teknik som IoT, Big Data och AI (Artificiell Intelligens) är det nödvändigt att möjliggöra ackumulering, kombination och analys av stora mängder information, inklusive verk. Därför har denna ändring infört en bestämmelse som tillåter användning av verk under vissa omständigheter, till exempel när verket inte används för njutning eller liknande ändamål.

Vad är den tillåtna användningen enligt artikel 30.4 i upphovsrättslagen?

I den ändrade japanska upphovsrättslagen artikel 30.4 år 2018, har det blivit tillåtet att använda verk “utan syfte att njuta av tankar eller känslor uttryckta i verket”, i den utsträckning det anses nödvändigt, oavsett metod.

(Användning utan syfte att njuta av tankar eller känslor uttryckta i verket)

Artikel 30.4 Verk kan användas, i den utsträckning det anses nödvändigt, oavsett metod, i följande fall och andra fall där syftet inte är att själv njuta av eller låta andra njuta av tankar eller känslor uttryckta i verket. Dock gäller detta inte om det, med hänsyn till verket typ och användning samt sättet för dess användning, skulle skada upphovsrättshavarens intressen på ett orättvist sätt.

1. När det används för tester för utveckling eller praktisk tillämpning av teknik relaterad till inspelning, filmning eller annan användning av verket

2. När det används för informationsanalys (detta avser att extrahera information relaterad till språk, ljud, bilder och andra element som utgör informationen från ett stort antal verk och annan omfattande information, och att utföra jämförelser, klassificeringar och andra analyser. Samma gäller i artikel 47.5, paragraf 1, punkt 2.)

3. När det, förutom i de fall som anges i de två föregående punkterna, används i processen för informationshantering med en dator eller annan användning av verket utan att människors uppfattning av verket uttryck åtföljs (för programverk, exklusive verkets utförande på en dator.)

Specifikt är användning av verk tillåten i följande fall:

・Att testa reproduktion av konstverk för att utveckla kameror eller skrivare som är lämpliga för reproduktion av konstverk

・Att samla in och använda verk som träningsdata för utveckling av artificiell intelligens, eller att tillhandahålla insamlade träningsdata till tredje part under syftet att utveckla artificiell intelligens (överföring eller offentlig överföring, etc.)

・Att kopiera verk i bakgrunden under datorns informationsbehandlingsprocess och använda den datan utan att människor uppfattar den alls

・Att använda programverk för syftet att undersöka och analysera program (så kallad “reverse engineering”)

Källa: Kulturbyrån | Om lagen som ändrar en del av upphovsrättslagen (Lag nr 30, Heisei 30)[ja]

Fall där användning av upphovsrättsligt skyddade verk i maskininlärning kan leda till brott mot upphovsrättslagen

Fall där användning av upphovsrättsligt skyddade verk i maskininlärning kan leda till brott mot upphovsrättslagen

Det är tillåtet enligt paragraf 30.4.2 i den japanska upphovsrättslagen (Japanese Copyright Law) att samla in, bearbeta och använda bilder (upphovsrättsligt skyddade verk) för maskininlärning, samt att tillhandahålla insamlade träningsdata till tredje part (genom försäljning, överföring etc.). Men det finns en risk att denna typ av användning kan leda till juridiska problem.

Låt oss överväga de juridiska problem som kan uppstå när bilder som publiceras på nätet samlas in för användning i maskininlärning.

Relaterad artikel: Hur mycket information på internet kan användas? En förklaring av upphovsrätt på nätet[ja]

När upphovsrättsinnehavarens intressen skadas orättvist

Enligt paragraf 30.4 i den japanska upphovsrättslagen (Japanese Copyright Law) är det tillåtet att använda upphovsrättsligt skyddade verk “utan syfte att njuta av tankar eller känslor uttryckta i verket”, men det är inte tillåtet att använda verket om det skadar upphovsrättsinnehavarens intressen orättvist.

Vilka specifika fall kan då tänkas? Enligt Agency for Cultural Affairs Q&A, kan följande fall anses vara “fall där upphovsrättsinnehavarens intressen skadas orättvist”.

Det slutliga beslutet kommer att fattas i domstol, men till exempel, om en databas som organiserar en stor mängd information på ett sätt som gör det lätt att använda för informationsanalys säljs, kan handlingen att kopiera denna databas för informationsanalys anses vara “ett fall där upphovsrättsinnehavarens intressen skadas orättvist”, eftersom det kolliderar med marknaden för försäljning av databasen.

Citat: Agency for Cultural Affairs Copyright Division | “Grundläggande tankar om flexibla rättighetsbegränsningar i samband med digitalisering och nätverkande”[ja] 

När en överenskommelse som skiljer sig från bestämmelserna i upphovsrättslagen har ingåtts

Även om det är tillåtet att använda upphovsrättsligt skyddade verk för maskininlärning enligt upphovsrättslagen, kan parterna komma överens om något annat. Om en sådan överenskommelse har ingåtts, kan du bli ansvarig för skadestånd om du bryter mot överenskommelsen.

Till exempel finns det webbplatser som uttryckligen förbjuder insamling och extraktion av data för maskininlärning och informationsanalys i sina användarvillkor och licensavtal. När du samlar in data måste du kontrollera webbplatsens användarvillkor och licensavtal.

Generellt sett krävs det någon form av åtgärd för att “godkänna” webbplatsens användarvillkor. Till exempel kan det krävas att du skapar ett konto, med meddelandet “Genom att skapa ett konto godkänner du användarvillkoren och sekretesspolicyn”, och att du klickar på en registrerings- eller godkännandeknapp. Genom att klicka på registrerings- eller godkännandeknappen ingås “överenskommelsen”.

Å andra sidan, om användarvillkoren som förbjuder insamling och extraktion av data endast visas på en sida som är separat från nedladdningssidan, och det är möjligt att ladda ner bilder utan att godkänna dem, anses “överenskommelsen” inte ha ingåtts. I detta fall gäller bestämmelserna i upphovsrättslagen, och det är tillåtet att använda upphovsrättsligt skyddade verk.

Men för att förebygga problem bör du undvika att samla in data från webbplatser som uttryckligen förbjuder insamling och extraktion av data i sina användarvillkor.

Relaterad artikel: Vad är skrapning? En förklaring av de juridiska frågorna kring denna populära datainsamlingsmetod[ja]

Bryter bilder skapade genom maskininlärning upphovsrättslagen?

Bryter bilder skapade genom maskininlärning upphovsrättslagen?

Vi har hittills förklarat att det är tillåtet att använda upphovsrättsligt skyddade verk för maskininlärning enligt upphovsrättslagen. Men, innebär det att AI, genom att utföra maskininlärning och skapa syntetiska bilder, bryter mot upphovsrätten för de ursprungliga bilderna (foton, illustrationer, målningar etc.) som används för inlärning?

Här kommer vi att förklara detta med hjälp av ett exempel där AI skapar bilder med hjälp av GAN (Generative Adversarial Networks).

Hur bilder skapas genom maskininlärning

GAN (Generative Adversarial Networks) är en typ av generativ modell som kan skapa icke-existerande data eller transformera existerande data baserat på de egenskaper den har lärt sig från data. Denna mekanism för bildgenerering med GAN används till exempel i tjänster som analyserar foton eller målningar av faktiska rum och skapar bilder som om möbler som passar budgeten och rummets storlek faktiskt är placerade där.

Kan AI bryta mot upphovsrätten för de ursprungliga bilderna den har lärt sig från?

GAN består av två neurala nätverk, en generator och en diskriminator. Av dessa tar genereraren de egenskaper som finns i den ursprungliga bilden och omvandlar dem till numeriska värden, och genom att mata in vissa variabler skapar den en syntetisk bild baserat på de justerade numeriska värdena som genereras av dessa variabler.

Med andra ord, eftersom den syntetiska bilden är en helt ny bild som skapas som ett resultat av att mata in variabler i funktionen under syntesprocessen, kan den sägas vara helt skild från den ursprungliga bilden (foto, illustration, målning etc.). Även om en bild som liknar den ursprungliga bilden skapas som ett resultat av maskininlärning, anses detta inte vara en kopia, bearbetning eller ändring av den ursprungliga inlärningsdatan.

Därför kan vi säga att syntetiska bilder skapade av AI genom maskininlärning inte bryter mot upphovsrätten för de ursprungliga bilderna som används för inlärning.

Relaterad artikel: Hur skyddas immateriella rättigheter vid AI-utveckling? En översikt över frågor om upphovsrätt och patent[ja]

Sammanfattning: Konsultera en advokat angående AI-maskininlärning och upphovsrättsfrågor

I den här artikeln har vi diskuterat problemen med upphovsrätten när det gäller att använda bilder som publiceras på nätet för AI-maskininlärning.

Det är tillåtet enligt upphovsrättslagen att använda upphovsrättsligt skyddade verk för maskininlärning (paragraf 30.4 i den japanska upphovsrättslagen). Det finns dock undantag. I vissa fall, till exempel när det orättvist skadar upphovsrättsinnehavarens intressen eller när parterna har kommit överens om något som strider mot bestämmelserna i upphovsrättslagen, kan användningen av upphovsrättsligt skyddade verk inte tillåtas.

AI som “Midjourney”, “Stable Diffusion” och “ChatGPT” har fått mycket uppmärksamhet, och antalet företag som börjar utveckla AI ökar snabbt. Eftersom det kan vara svårt att avgöra om det är tillåtet att använda upphovsrättsligt skyddade verk som träningsdata, som är oumbärliga för AI-utveckling, rekommenderar vi att du konsulterar en advokat som är kunnig inom IT-området när du driver en verksamhet som använder AI och maskininlärning.

Information om åtgärder från vår byrå

Monolith Advokatbyrå är en juridisk byrå med omfattande erfarenhet inom IT, särskilt internet och juridik.

AI-verksamhet medför många juridiska risker, och det är absolut nödvändigt med stöd från advokater som är väl insatta i juridiska frågor relaterade till AI. Vårt team, bestående av advokater och ingenjörer som är kunniga inom AI, erbjuder avancerat juridiskt stöd för AI-verksamheter, inklusive ChatGPT. Detta inkluderar att skapa kontrakt, granska lagligheten av affärsmodeller, skydda immateriella rättigheter och hantera sekretess. Mer detaljer finns i artikeln nedan.

Monolith Advokatbyrås områden: AI (ChatGPT etc.) juridik[ja]

Managing Attorney: Toki Kawase

The Editor in Chief: Managing Attorney: Toki Kawase

An expert in IT-related legal affairs in Japan who established MONOLITH LAW OFFICE and serves as its managing attorney. Formerly an IT engineer, he has been involved in the management of IT companies. Served as legal counsel to more than 100 companies, ranging from top-tier organizations to seed-stage Startups.

Tillbaka till toppen