La scansione di immagini su Internet viola la legge sul diritto d'autore? Spiegazione dei problemi legali dell'apprendimento automatico

Negli ultimi anni, i progressi nella tecnologia AI (Intelligenza Artificiale) sono stati notevoli, con diverse AI come “Stable Diffusion” e “Midjourney”, che generano immagini, e “ChatGPT”, che genera testi, che stanno attirando l’attenzione. Facendo apprendere all’AI attraverso il crawling dei dati online, è possibile fare molte cose utilizzando l’AI, e mentre l’accuratezza dell’apprendimento automatico sta migliorando, si segnala il rischio di violazione del diritto d’autore.
Il crawling di vari dati come immagini e illustrazioni pubblicate online, la loro raccolta senza permesso e l’uso per l’apprendimento automatico dell’AI, costituiscono una violazione del diritto d’autore?
In questo articolo, spiegheremo i problemi legali relativi all’uso di immagini e illustrazioni pubblicate online per l’apprendimento automatico.
Cos’è l’apprendimento automatico

L’apprendimento automatico (ML: Machine Learning) è un processo in cui una macchina impara dai dati, proprio come gli esseri umani imparano dall’esperienza. Nel processo di apprendimento automatico, è necessario raccogliere dati, selezionarli e lavorarli per creare un set di dati per l’apprendimento.
Il crawling è un processo in cui un programma chiamato crawler naviga nei siti web e duplica e salva le informazioni, come testi e immagini, presenti nelle pagine web.
Articolo correlato: Cos’è lo scraping? Spieghiamo le questioni legali di questo utile metodo di raccolta dati che sta attirando l’attenzione[ja]
Problemi relativi al diritto d’autore nell’apprendimento automatico
“Diritto d’autore”, in termini semplici, si riferisce al diritto di proteggere legalmente le opere. E le “opere” protette sono definite come segue nell’articolo 2, paragrafo 1, della Legge sul diritto d’autore giapponese.
(Definizione)
Articolo 2 In questa legge, il significato dei termini elencati nei seguenti punti è determinato come stabilito in ciascuno di essi.
1. Opera: si intende qualcosa che esprime creativamente pensieri o sentimenti e che appartiene al campo della letteratura, della scienza, dell’arte o della musica.
Il contesto della revisione della Legge sul diritto d’autore del 2018 (Anno 30 dell’era Heisei)
Nel 2018 (Anno 30 dell’era Heisei), la Legge sul diritto d’autore è stata modificata e messa in vigore dal 1° gennaio 2019 (Anno 31 dell’era Heisei).
Per sfruttare tecnologie come IoT, Big Data e AI (Intelligenza Artificiale), è necessario consentire l’accumulo, la combinazione e l’analisi di grandi quantità di informazioni, comprese le opere. Pertanto, questa revisione ha stabilito una disposizione che consente l’uso delle opere in certi casi, come quando non vengono utilizzate per scopi di apprezzamento.
Cosa permette l’articolo 30-4 della Legge sul diritto d’autore modificata nel 2018
Nell’articolo 30-4 della Legge sul diritto d’autore, modificata nel 2018, è stato permesso l’uso delle opere “senza l’intento di godere dei pensieri o dei sentimenti espressi nell’opera”, indipendentemente dal metodo, entro i limiti ritenuti necessari.
(Uso senza l’intento di godere dei pensieri o dei sentimenti espressi nell’opera)
Articolo 30-4 Le opere possono essere utilizzate, in qualsiasi modo, entro i limiti ritenuti necessari, nei casi elencati di seguito e in altri casi in cui non si intende godere personalmente o far godere ad altri i pensieri o i sentimenti espressi nell’opera. Tuttavia, questo non si applica se, alla luce del tipo e dell’uso dell’opera e della modalità di utilizzo, ciò danneggerebbe ingiustamente gli interessi del titolare del diritto d’autore.
1. Quando viene utilizzato per test per lo sviluppo o la commercializzazione di tecnologie relative all’uso di opere, come la registrazione o la riproduzione.
2. Quando viene utilizzato per l’analisi delle informazioni (estrarre informazioni relative agli elementi linguistici, sonori, visivi, ecc. che costituiscono le informazioni da un gran numero di opere e altre grandi quantità di informazioni, e condurre analisi come il confronto e la classificazione. Lo stesso si applica all’articolo 47-5, paragrafo 1, punto 2).
3. Oltre ai casi elencati nei punti 1 e 2, quando l’opera viene utilizzata nel processo di elaborazione delle informazioni da un computer senza la percezione umana dell’espressione dell’opera, o per altri usi (escludendo l’esecuzione dell’opera del programma su un computer nel caso di opere di programmi).
Specificamente, l’uso delle opere è permesso nei seguenti casi:
・Azioni come la riproduzione sperimentale di opere d’arte per sviluppare fotocamere o stampanti adatte alla riproduzione di opere d’arte.
・Azioni come la raccolta e l’uso di opere come dati di apprendimento per lo sviluppo dell’intelligenza artificiale, o la fornitura (trasferimento o trasmissione pubblica, ecc.) di dati di apprendimento raccolti a terzi per lo sviluppo dell’intelligenza artificiale.
・Azioni come la copia di opere nel backend durante il processo di elaborazione delle informazioni del computer e l’uso di tali dati senza alcuna percezione umana.
・Azioni come l’uso di opere di programmi per l’analisi e l’indagine dei programmi (cosiddetto “reverse engineering”).
Casi in cui l’utilizzo di opere d’arte per l’apprendimento automatico può violare la legge sul diritto d’autore giapponese

È consentito, ai sensi dell’articolo 30-4, paragrafo 2, della legge giapponese sul diritto d’autore, raccogliere, elaborare e utilizzare immagini (opere d’arte) per l’apprendimento automatico, così come fornire i dati di apprendimento raccolti a terzi (vendita, trasferimento, ecc.). Tuttavia, tale utilizzo di opere d’arte può potenzialmente portare a problemi legali.
Esamineremo qui i problemi legali che possono sorgere quando si raccolgono immagini pubblicate online per l’apprendimento automatico.
Articolo correlato: Fino a che punto è possibile utilizzare le informazioni su Internet? Spiegazione sui diritti d’autore su Internet[ja]
Nel caso in cui si danneggino ingiustamente gli interessi del titolare del diritto d’autore
L’articolo 30-4 della legge giapponese sul diritto d’autore consente “l’uso che non ha lo scopo di godere del pensiero o dell’emozione espressa nell’opera d’arte”, ma non consente l’uso dell’opera d’arte se tale uso danneggia ingiustamente gli interessi del titolare del diritto d’autore.
Quali sono i casi specifici? Secondo le FAQ dell’Agenzia per gli Affari Culturali, i seguenti casi sono considerati “casi in cui si danneggiano ingiustamente gli interessi del titolare del diritto d’autore”.
La decisione finale sarà presa in tribunale, ma ad esempio, se un’opera d’arte che è un database organizzato in modo da poter facilmente utilizzare una grande quantità di informazioni per l’analisi delle informazioni è in vendita, l’atto di copiare tale database per l’analisi delle informazioni può essere considerato un “caso in cui si danneggiano ingiustamente gli interessi del titolare del diritto d’autore” in quanto entra in conflitto con il mercato di vendita del database.
Citazione: Divisione del diritto d’autore dell’Agenzia per gli Affari Culturali | “Pensiero fondamentale sulla regolamentazione flessibile dei diritti in risposta all’avanzamento della digitalizzazione e della rete”[ja]
Nel caso in cui si raggiunga un accordo diverso dalle disposizioni della legge sul diritto d’autore
La legge giapponese sul diritto d’autore consente l’uso di opere d’arte per l’apprendimento automatico, ma le parti possono anche raggiungere un accordo diverso. Se tale accordo è stato raggiunto, si può essere tenuti responsabili per i danni se si viola l’accordo.
Ad esempio, ci sono siti che proibiscono esplicitamente la raccolta e l’estrazione di dati per l’apprendimento automatico e l’analisi delle informazioni nei loro termini di servizio o nei contratti di licenza. Quando si raccolgono dati, è necessario controllare i termini di servizio o i contratti di licenza del sito.
In generale, per “accettare” i termini di servizio di un sito, è richiesta qualche azione. Ad esempio, si può essere richiesto di registrarsi o di premere un pulsante di accettazione, insieme a una dichiarazione come “Creando un account, si accettano i termini di servizio e la politica sulla privacy”. L'”accordo” si forma quando si clicca per registrarsi o accettare.
D’altra parte, se i termini di servizio che proibiscono semplicemente la raccolta e l’estrazione di dati sono pubblicati su una pagina diversa dalla pagina di download del sito, e si possono scaricare le immagini senza accettare tali termini, l'”accordo” non è stato raggiunto. In questo caso, si applicano le disposizioni della legge sul diritto d’autore, e si può utilizzare l’opera d’arte.
Tuttavia, per prevenire problemi, è meglio evitare di raccogliere dati da siti che proibiscono esplicitamente la raccolta e l’estrazione di dati nei loro termini di servizio.
Articolo correlato: Cos’è lo scraping? Spiegazione delle questioni legali di un metodo di raccolta dati che sta attirando l’attenzione[ja]
Le immagini sintetizzate attraverso l’apprendimento automatico violano il diritto d’autore?

Finora, abbiamo spiegato che l’uso di opere d’arte per l’apprendimento automatico è riconosciuto dalla legge sul diritto d’autore. Ma, se l’IA esegue l’apprendimento automatico e crea immagini sintetiche, viola i diritti d’autore delle immagini originali (foto, illustrazioni, dipinti, ecc.) utilizzate per l’apprendimento?
Qui, spiegheremo prendendo come esempio il caso in cui l’IA genera immagini attraverso GAN (Generative Adversarial Networks).
Il funzionamento della generazione di immagini attraverso l’apprendimento automatico
Il GAN (Generative Adversarial Networks) è un tipo di modello generativo che può creare dati non esistenti o trasformare dati esistenti in base alle caratteristiche apprese dai dati. Il funzionamento della generazione di immagini attraverso GAN, ad esempio, viene utilizzato anche in servizi che analizzano foto o dipinti di stanze reali e sintetizzano immagini come se i mobili adatti al budget o alle dimensioni della stanza fossero effettivamente posizionati lì.
L’IA può violare i diritti d’autore delle immagini originali apprese?
Il GAN è composto da due reti neurali, il generatore (Generator) e il discriminatore (Discriminator). Il generatore legge le caratteristiche dell’immagine originale trasformandole in numeri e, inserendo una certa variabile, genera un’immagine sintetica emettendo numeri regolati da quella variabile.
Quindi, l’immagine sintetica è un’immagine generata come risultato dell’inserimento di una variabile in una funzione durante il processo di sintesi, quindi può essere considerata completamente diversa dai dati dell’immagine originale (foto, illustrazioni, dipinti, ecc.). Anche se, come risultato dell’apprendimento automatico, viene sintetizzata un’immagine simile all’immagine originale, non si ritiene che ciò costituisca una riproduzione, un adattamento o una modifica dei dati di apprendimento originali.
Quindi, si può dire che le immagini sintetiche generate dall’IA attraverso l’apprendimento automatico non violano i diritti d’autore delle immagini originali utilizzate per l’apprendimento.
Articolo correlato: Come sono protetti i diritti di proprietà intellettuale nello sviluppo dell’IA? Organizzazione dei punti su diritto d’autore e diritto di brevetto[ja]
Riassunto: Consulta un avvocato per questioni di diritto d’autore e apprendimento automatico dell’IA
In questo articolo, abbiamo discusso i problemi legali relativi all’uso delle immagini pubblicate online per l’apprendimento automatico dell’Intelligenza Artificiale (IA) secondo la legge sul diritto d’autore giapponese.
L’uso di opere protette da copyright per l’apprendimento automatico è consentito dalla legge sul diritto d’autore giapponese (Articolo 30-4 della Legge Giapponese sul Diritto d’Autore). Tuttavia, ci sono eccezioni. Ad esempio, l’uso di tali opere potrebbe non essere consentito se danneggia ingiustamente gli interessi del titolare del copyright o se le parti hanno concordato termini che differiscono dalle disposizioni della legge sul diritto d’autore.
Con l’aumento dell’attenzione su IA come “Midjourney”, “Stable Diffusion”, “ChatGPT” e l’aumento delle aziende che si avventurano nello sviluppo di ulteriori IA, la questione se l’uso di opere protette da copyright come dati di apprendimento per l’IA sia consentito o meno può essere difficile da determinare. Pertanto, se stai pianificando un’attività che utilizza l’IA e l’apprendimento automatico, ti consigliamo di consultare un avvocato esperto nel campo dell’IT.
Presentazione delle misure adottate dal nostro studio legale
Lo Studio Legale Monolith è un’agenzia legale con una vasta esperienza in IT, in particolare nell’intersezione tra Internet e legge.
Il business dell’IA comporta molti rischi legali e richiede il supporto di avvocati esperti in questioni legali relative all’IA. Il nostro studio legale, con un team di avvocati esperti in IA e ingegneri, fornisce un supporto legale avanzato per le attività di IA, inclusa ChatGPT, come la creazione di contratti, l’esame della legalità del modello di business, la protezione dei diritti di proprietà intellettuale e la gestione della privacy. I dettagli sono descritti nell’articolo sottostante.
Settori di competenza dello Studio Legale Monolith: Legge sull’IA (ChatGPT, ecc.)[ja]
Category: IT