MONOLITH LAW OFFICE+81-3-6262-3248Vardagar 10:00-18:00 JST [English Only]

MONOLITH LAW MAGAZINE

IT

Kan skapandet av "röster" med AI leda till upphovsrättsintrång? (#1 Utvecklings- och inlärningsfasen)

IT

Kan skapandet av

Med utvecklingen av generativ AI har det blivit möjligt att enkelt lära upp och skapa ‘röster’ som tillhör verkliga sångare eller röstskådespelare. Även inom affärsvärlden har det blivit möjligt att låta AI lära sig ‘röster’ och generera nya ‘röster’ för apputveckling, spelkreation och animeproduktion.

Att lära en generativ AI att imitera röster av verkliga sångare eller röstskådespelare och skapa nya ‘röster’ kan potentiellt utgöra en överträdelse av upphovsrätten eller andra olagliga handlingar under japansk lag.

I själva verket finns det för närvarande ingen klar tolkning av dessa frågor. Vad är de juridiska rättigheterna associerade med en ‘röst’, och i vilka fall kan det bli ett problem enligt upphovsrättslagen i Japan?

Här kommer vi att förklara denna fråga i två delar, med tanke på specifika användningsmönster. I denna första del kommer vi att diskutera potentiella rättighetsintrång under utvecklings- och inlärningsfasen av generativ AI. Juridiska frågor vid generering och användning av ‘röster’ förklaras i denna artikel (Del 2: Generering och användningsfas)[ja]. Vänligen se även den för ytterligare information.

Tre juridiska rättigheter associerade med en persons ‘röst’

Vilka juridiska rättigheter är associerade med en persons ‘röst’? För att överväga denna fråga behöver vi ha två perspektiv på ‘rösten’:

  1. Vad rösten säger,
  2. Hur rösten låter.

Med andra ord kan vi skilja mellan ‘röstens’ innehåll och ‘röstens’ ljud.

Till exempel, om olika röstskådespelare säger repliken “god morgon”, är innehållet detsamma i det första perspektivet, men ljudet skiljer sig i det andra perspektivet.

Med dessa perspektiv i åtanke kan vi under japansk lagstiftning identifiera följande tre juridiska rättigheter som kan uppstå i samband med en persons ‘röst’:

① UpphovsrättKan uppstå i relation till röstens ‘innehåll’
② Närstående rättigheter (begränsade till utövande konstnärers rättigheter)Kan uppstå i relation till både röstens ‘innehåll’ och ‘ljud’
③ PublicitetsrättKan uppstå i relation till röstens ‘ljud’

Om upphovsrätt

Upphovsrätt uppstår när innehållet i en röst anses vara ett verk som omfattas av upphovsrätten.

Till exempel, när man läser upp en känd roman, kan rösten som används potentiellt inneha upphovsrätt. Det viktiga att notera är dock att i sådana fall är det författaren av romanen som innehar upphovsrätten, inte personen som läser upp verket, det vill säga “röstens ägare”. Det innebär att om man skapar en syntetisk röst som läser upp en känd roman med hjälp av AI, kan detta agerande potentiellt innebära en kränkning av romanförfattarens upphovsrätt.

Å andra sidan, om innehållet i rösten består av vanliga vardagliga konversationer, uppstår ingen upphovsrätt för rösten. Detta beror på att vanliga konversationer i sig inte anses vara verk och därmed inte skyddas av upphovsrättslagen.

Om närstående rättigheter till upphovsrätt i Japan

Närstående rättigheter till upphovsrätt, begränsade till rättigheter för utövande artister, kan uppstå när innehållet i en röst anses vara ett verk, som i fallet när rösten används i en form av framförande såsom uppläsning.

Som nämnts i avsnittet om upphovsrätt ovan, kan en person som utför en uppläsning – en form av framförande – därmed ha närstående rättigheter till upphovsrätt. Det är viktigt att notera att, till skillnad från fallet med upphovsrätt, är innehavaren av de närstående rättigheterna inte författaren av romanen, utan den person som faktiskt utför uppläsningen.

Om publicitetsrätt i Japan

Publicitetsrätten är en rättighet som erkänns genom rättspraxis (Högsta domstolens beslut H24 (2012).2.2) och definieras som “rätten att exklusivt utnyttja den kunddragande kraft som en persons namn, porträtt och liknande besitter”.

▶︎ Högsta domstolens beslut H24 (2012).2.2 (Pink Lady-fallet)
■ Domstolens utslag
① När ett namn eller porträtt i sig används som en vara som kan betraktas oberoende,
② När ett namn eller porträtt används för att differentiera varan i syfte att skilja den från andra,
③ När ett namn eller porträtt används som reklam för varan, med det huvudsakliga syftet att utnyttja den kunddragande kraft som namnet eller porträttet besitter, kan detta utgöra en kränkning av publicitetsrätten och därmed vara olagligt enligt lag om otillbörliga handlingar
■ Kommentar från undersökningsledaren (Högsta domstolens rättsfallssamling, civilrätt, år H24 (2012) del 1, sida 18) I detta domslut avser “porträtt och liknande” information som identifierar personen, vilket inkluderar exempelvis autografer, signaturer, röster, pseudonymer, artistnamn, etc.

Enligt Pink Lady-fallet finns det möjlighet att röster kan omfattas av publicitetsrätten. Om det kan fastställas att rösten tillhör en verklig person med kunddragande kraft, såsom en röstskådespelare, skådespelare eller sångare, så uppstår publicitetsrätten oavsett “innehållet”. Om rösten sedan används på något av de tre sätt som kränker publicitetsrätten enligt Pink Lady-fallet, så utgör det en överträdelse av publicitetsrätten.

Tre användningsmönster under utvecklings- och inlärningsfasen

Att säga att man “genererar röster med generativ AI” kan låta enkelt, men processen kan delas in i följande två steg:

  1. Utvecklings- och inlärningsfasen
  2. Genererings- och användningsfasen

Det första steget utförs av AI-utvecklare, medan det andra steget hanteras av AI-användare.

Om vi visualiserar dessa steg ser det ut som följer:

Generativ AI-process

Under utvecklings- och inlärningsfasen samlar och lagrar man röstdata från människor som lärande data för AI-utveckling och skapar en dataset för inlärning. Därefter matas detta dataset in i AI:n för maskininlärning, vilket resulterar i en tränad modell. Under genererings- och användningsfasen matas originaldata in i den färdigtränade generativa AI:n för att skapa och använda AI-genererat material.

För utvecklings- och inlärningsfasen kan vi förutse följande tre användningsmönster:

  • Mönster 1: Insamling, lagring, bearbetning och användning av mänsklig röstdata som inlärningsdata för AI-utveckling
  • Mönster 2: Försäljning eller offentliggörande av dataset för inlärning som används i AI-utveckling
  • Mönster 3: Försäljning eller offentliggörande av den generativa AI:n själv

I det följande kommer vi kort att förklara vilka typer av rättighetsintrång som kan uppstå i varje användningsmönster.

Mönster 1: Insamling, ackumulering, bearbetning och användning av mänskliga röstdata för AI-utveckling

Mönster 1: Insamling, ackumulering, bearbetning och användning av mänskliga röstdata för AI-utveckling

Först förklarar vi de potentiella rättighetsintrången som kan uppstå i samband med insamling, ackumulering, bearbetning och användning av mänskliga röstdata för att träna AI.

Relationen till upphovsrätten

Användningen i mönster 1 innebär specifikt att utveckla själva genererade AI:n. AI-utvecklingen faller under “informationsanalys” enligt artikel 30-4 nummer 2 i upphovsrättslagen (nedan kallad lagen), och därför är användningen av nödvändiga upphovsrättsliga verk i princip inte en upphovsrättsintrång (artikel 30-4).

Det finns dock ett betydande undantag. Om syftet med att skapa en träningsdataset är att generera AI-produkter som har de väsentliga uttrycksdrag som ursprungsdatan har (uttrycksutgångssyfte), är artikel 30-4 inte tillämplig och användningen blir olaglig.

Det innebär att om man använder röstdata från andra röstskådespelare för att återskapa eller hylla en specifik röstskådespelares karaktäristiska röst, och det finns ett uttrycksutgångssyfte, kan användningen utgöra en upphovsrättsintrång.

Relationen till närstående rättigheter

I relation till närstående rättigheter tillämpas också artikel 30-4 i lagen enligt artikel 102, så att även om man utför framträdanden etc. för att utveckla genererade AI, utgör det i princip inte en intrång i närstående rättigheter.

Relationen till publicitetsrätten

Publicitetsrätten blir relevant när utvecklingen av genererade AI syftar till att skapa “röster” av specifika kända personer med dragkraft för kunder.

För att avgöra om det utgör en intrång i publicitetsrätten kan de tre typerna av intrång som identifierades i Pink Lady-fallet vara vägledande.

Först och främst utgör själva handlingen att utveckla genererade AI med syftet att skapa en specifik känd persons “röst” inte en av de tre typerna av intrång som identifierades i Pink Lady-fallet. Men om handlingen “uteslutande syftar till att använda dragkraften som namn, porträtt etc. har”, kan det utgöra en intrång i publicitetsrätten och därmed vara en olaglig handling.

För att dragkraften ska kunna användas måste det vara möjligt för tredje part att uppfatta att det är den kända personens röst när man skapar träningsdatasetet. Om kunderna som tredje part inte kan uppfatta detta, kan det inte uppstå någon kunddragning. Men vanligtvis finns det ingen möjlighet för kunder som tredje part att vara inblandade i utvecklingsstadiet av genererade AI.

Därför kan man säga att det knappast finns något utrymme för att användningen skulle utgöra en intrång i publicitetsrätten.

Mönster 2: Försäljning och offentliggörande av träningsdataset för AI-utveckling

Här förklarar vi potentiella intrång på rättigheter som kan uppstå vid försäljning och offentliggörande av träningsdataset för AI-lärande.

Förhållandet till upphovsrätt

Om träningsdataset innehåller originaldata i oförändrad form eller i något bearbetad form, kan försäljning och offentliggörande av träningsdataset utgöra ett intrång på överlåtelse- (artikel 26.2) och offentliggöranderätten (artikel 23) för det aktuella upphovsrättsliga verket eller för ett härlett verk (artikel 28). Därför blir det en upphovsrättsintrång om det görs utan upphovspersonens samtycke.

Emellertid, enligt artikel 30.4, i “fall av användning för informationsanalys”, är det tillåtet att “använda det på vilket sätt som helst, i den utsträckning det anses nödvändigt”. Således, när överföring eller offentliggörande görs för att utveckla genererad AI, utgör det inte en upphovsrättsintrång så länge det håller sig inom de nödvändiga gränserna.

Förhållandet till närstående rättigheter

På samma sätt som ovan är artikel 102 tillämplig, vilket innebär att bestämmelserna i artikel 30.4 gällande upphovsrätt även tillämpas här, så försäljning och offentliggörande av träningsdataset för utveckling av genererad AI utgör i princip inte ett intrång på närstående rättigheter.

Förhållandet till rätten till publicitet

I vissa träningsdataset kan specifika kända personers röster sparas i ett format som kan återges direkt. Men träningsdataset används vanligtvis endast för att utveckla genererad AI och kan inte anses vara “användning av namn, porträtt etc. som självständiga objekt för betraktning i varor”, som det fastställdes i det högsta domstolens beslut i Pink Lady-fallet.

Därför kan det sägas att det knappast finns något utrymme för att den aktuella användningen skulle utgöra ett intrång på rätten till publicitet.

Mönster 3: Försäljning och offentliggörande av genererad AI i sig

Mönster 3: Försäljning och offentliggörande av genererad AI i sig

Här förklarar vi de potentiella rättighetsintrången som kan uppstå vid försäljning och offentliggörande av den färdigtränade modellen i sig.

Förhållandet till upphovsrätt

Till skillnad från träningsdatauppsättningar kan man inte föreställa sig att den färdigtränade modellen av genererad AI i sig behåller några kreativa delar av originaldatan (upphovsrättsligt skyddade verk). Därför kan den färdigtränade modellen av genererad AI i sig inte betraktas som ett sekundärt upphovsrättsligt verk, och dess offentliggörande eller försäljning utgör inte ett brott mot upphovsrätten.

Förhållandet till närstående rättigheter

Precis som ovan kan man inte föreställa sig att den färdigtränade modellen behåller några kreativa delar av originaldatan. Därför utgör försäljning och offentliggörande av genererad AI i sig inte ett intrång i närstående rättigheter.

Förhållandet till publicitetsrätt

Även en AI som kan generera en specifik kändis röst fritt och med hög precision faller inte under de tre typerna av intrång som fastställdes i det högsta domstolens beslut i Pink Lady-fallet. Vanligtvis marknadsförs sådan AI på värdet av att kunna generera en specifik kändis röst fritt och med hög precision, och kunder köper vanligtvis AI:n av samma anledning. Därför kan försäljningen av sådan AI anses utgöra ett intrång i publicitetsrätten som en liknande handling till de tre typerna av intrång.

Sammanfattning: Rådfråga experter angående förhållandet mellan generativ AI och upphovsrätt

Hittills har vi förklarat de juridiska rättigheterna som en persons röst innehar och de handlingar som kan bli problematiska när man använder dessa rättigheter, baserat på konkreta exempel.

Det är viktigt att förstå att de juridiska rättigheterna för en persons röst behöver övervägas separat i termer av “innehåll” och “ljud”, och att man bör beakta upphovsrätt, närstående rättigheter och publicitetsrättigheter. Här har vi fokuserat på utvecklings- och inlärningsfasen som en första del, men i nästa del kommer vi att förklara genererings- och användningsfasen.

Relaterad artikel: Kan generering av ‘röst’ med AI leda till upphovsrättsintrång? (#2 Genererings- och användningsfasen)[ja]

Vår byrås åtgärder

Monolith Advokatbyrå är en juridisk firma med omfattande erfarenhet inom IT, särskilt internet och juridik. På senare tid har generativ AI och immateriella rättigheter, såsom upphovsrätt, fått ökad uppmärksamhet, och behovet av juridisk granskning har blivit allt större. Vår byrå erbjuder lösningar relaterade till immateriella rättigheter. Följande artikel innehåller mer detaljerad information.

Monolith Advokatbyrås expertisområden: IT- och immaterialrättsjuridik för olika företag[ja]

Managing Attorney: Toki Kawase

The Editor in Chief: Managing Attorney: Toki Kawase

An expert in IT-related legal affairs in Japan who established MONOLITH LAW OFFICE and serves as its managing attorney. Formerly an IT engineer, he has been involved in the management of IT companies. Served as legal counsel to more than 100 companies, ranging from top-tier organizations to seed-stage Startups.

Tillbaka till toppen