MONOLITH LAW OFFICE+81-3-6262-3248Jours ouvrables 10:00-18:00 JST[English Only]

MONOLITH LAW MAGAZINE

IT

La collecte d'images sur Internet viole-t-elle le droit d'auteur ? Explication des problèmes juridiques de l'apprentissage automatique

IT

La collecte d'images sur Internet viole-t-elle le droit d'auteur ? Explication des problèmes juridiques de l'apprentissage automatique

Récemment, les progrès de l’IA (Intelligence Artificielle) ont été remarquables, et diverses IA comme “Stable Diffusion” et “Midjourney”, qui génèrent des images, ou “ChatGPT”, qui génère des textes, attirent l’attention. En faisant apprendre à l’IA par le biais du crawling des données sur Internet, il est possible de faire diverses choses en utilisant l’IA, et bien que la précision de l’apprentissage automatique s’améliore, le risque de violation du droit d’auteur est souligné.

Est-ce que le fait de collecter sans autorisation diverses données telles que des images et des illustrations publiées sur Internet, de les traiter et de les utiliser pour l’apprentissage automatique de l’IA ne constitue pas une violation du droit d’auteur ?

Dans cet article, nous expliquerons les problèmes juridiques liés à l’utilisation des images et illustrations publiées sur Internet pour l’apprentissage automatique.

Qu’est-ce que l’apprentissage automatique

Qu'est-ce que l'apprentissage automatique

L’apprentissage automatique (ML : Machine Learning) est le processus par lequel une machine apprend à partir de données, de la même manière que les humains apprennent de l’expérience. Dans le processus d’apprentissage automatique, il est nécessaire de collecter des données, de sélectionner et de traiter ces données pour créer un ensemble de données d’apprentissage.

Le crawling est le processus par lequel un programme appelé crawler parcourt les sites Web et copie et sauvegarde les informations telles que le texte et les images présentes sur les pages Web.

Article connexe : Qu’est-ce que le scraping ? Explication des problèmes juridiques de cette méthode de collecte de données pratique qui attire l’attention[ja]

Problèmes liés au droit d’auteur dans l’apprentissage automatique

Le “droit d’auteur”, pour le dire simplement, est le droit qui protège légalement les œuvres. Et les “œuvres” qui sont protégées sont définies comme suit à l’article 2, paragraphe 1, de la loi japonaise sur le droit d’auteur.

(Définition)

Article 2 Dans cette loi, la signification des termes énumérés ci-dessous est déterminée comme stipulé dans chaque numéro.

1. Œuvre : C’est quelque chose qui exprime de manière créative des pensées ou des sentiments et qui appartient au domaine de la littérature, des sciences, des arts ou de la musique.

Contexte de la révision de la loi sur le droit d’auteur en 2018 (Heisei 30)

En 2018 (Heisei 30), la loi révisée sur le droit d’auteur a été promulguée et est entrée en vigueur le 1er janvier 2019 (Heisei 31).

Pour exploiter des technologies telles que l’IoT, les Big Data et l’IA (Intelligence Artificielle), il est nécessaire de permettre l’accumulation, la combinaison et l’analyse d’une grande quantité d’informations, y compris des œuvres. Par conséquent, cette révision a établi une disposition permettant l’utilisation d’œuvres dans certains cas, comme lorsque l’œuvre n’est pas utilisée à des fins de contemplation.

Qu’est-ce qui est autorisé par l’article 30-4 de la loi japonaise sur le droit d’auteur?

Dans l’article 30-4 de la loi sur le droit d’auteur, révisée en 2018, il est désormais permis d’utiliser des œuvres, sans égard à la méthode, dans la mesure jugée nécessaire, pour des utilisations qui ne visent pas à jouir des pensées ou des sentiments exprimés dans l’œuvre.

(Utilisation qui ne vise pas à jouir des pensées ou des sentiments exprimés dans l’œuvre)

Article 30-4 Les œuvres peuvent être utilisées, sans égard à la méthode, dans la mesure jugée nécessaire, dans les cas énumérés ci-dessous et dans d’autres cas où l’utilisation ne vise pas à jouir soi-même ou à faire jouir autrui des pensées ou des sentiments exprimés dans l’œuvre. Cependant, cela ne s’applique pas si cela porte injustement atteinte aux intérêts du titulaire du droit d’auteur, compte tenu du type et de l’usage de l’œuvre et de la manière dont elle est utilisée.

1. Lorsqu’elle est utilisée pour des tests en vue du développement ou de la mise en pratique de technologies liées à l’enregistrement, à l’enregistrement vidéo ou à d’autres utilisations de l’œuvre

2. Lorsqu’elle est utilisée pour l’analyse de l’information (c’est-à-dire l’extraction d’informations relatives aux éléments linguistiques, sonores, visuels ou autres qui composent l’information à partir d’un grand nombre d’œuvres ou d’autres informations en grande quantité, et la réalisation de comparaisons, de classifications ou d’autres analyses. La même chose s’applique à l’article 47-5, paragraphe 1, numéro 2.)

3. Dans les cas autres que ceux énumérés aux numéros 1 et 2 ci-dessus, lorsque l’œuvre est utilisée dans le processus de traitement de l’information par ordinateur ou d’autres utilisations sans la reconnaissance par la perception humaine de l’expression de l’œuvre (à l’exception de l’exécution de l’œuvre du programme dans un ordinateur, dans le cas des œuvres de programme).

Plus précisément, l’utilisation des œuvres est autorisée dans les cas suivants :

・L’acte de reproduire des œuvres d’art à titre d’essai pour développer des caméras ou des imprimantes adaptées à la reproduction d’œuvres d’art

・L’acte de collecter et d’utiliser des œuvres comme données d’apprentissage pour le développement de l’intelligence artificielle, ou de fournir (transférer ou transmettre au public, etc.) les données d’apprentissage collectées à des tiers dans le cadre du développement de l’intelligence artificielle

・L’acte d’utiliser des œuvres en les copiant dans le backend du processus de traitement de l’information par ordinateur, sans que les données soient perçues par l’homme

・L’acte d’utiliser des œuvres de programme à des fins d’enquête et d’analyse (ce qu’on appelle le “reverse engineering”)

Source : Agence pour les Affaires Culturelles | À propos de la loi modifiant une partie de la loi japonaise sur le droit d’auteur (Loi de 2018, n° 30)[ja]

Cas où l’utilisation d’œuvres protégées par le droit d’auteur pour l’apprentissage automatique pourrait constituer une violation du droit d’auteur

Cas où l'utilisation d'œuvres protégées par le droit d'auteur pour l'apprentissage automatique pourrait constituer une violation du droit d'auteur

Comme cela, il est bien sûr permis de collecter, de traiter et d’utiliser des images (œuvres protégées par le droit d’auteur) pour l’apprentissage automatique, et de fournir les données d’apprentissage collectées à des tiers (vente, transfert, etc.) en vertu de l’article 30-4, paragraphe 2, de la loi japonaise sur le droit d’auteur. Cependant, cette utilisation d’œuvres protégées par le droit d’auteur pourrait potentiellement conduire à des problèmes juridiques.

Examinons ici les problèmes juridiques qui pourraient survenir lors de l’utilisation d’images publiées en ligne pour l’apprentissage automatique.

Article connexe : Jusqu’où peut-on utiliser les informations sur Internet ? Explication sur le droit d’auteur sur Internet[ja]

Dans le cas où les intérêts du titulaire du droit d’auteur sont injustement lésés

L’article 30-4 de la loi japonaise sur le droit d’auteur autorise “l’utilisation qui n’a pas pour but de jouir des idées ou des sentiments exprimés dans l’œuvre”, mais n’autorise pas l’utilisation de l’œuvre si elle porte injustement atteinte aux intérêts du titulaire du droit d’auteur.

Quels sont les cas concrets qui pourraient être envisagés ? Selon la FAQ de l’Agence pour les Affaires culturelles, les cas suivants sont considérés comme “portant injustement atteinte aux intérêts du titulaire du droit d’auteur”.

Bien que le jugement concret soit finalement rendu par le tribunal, par exemple, si une base de données d’œuvres qui organise une grande quantité d’informations de manière à faciliter leur analyse est vendue, l’acte de reproduire cette base de données à des fins d’analyse d’informations serait considéré comme “portant injustement atteinte aux intérêts du titulaire du droit d’auteur” car il entre en conflit avec le marché de la vente de cette base de données.

Citation : Agence pour les Affaires culturelles, Division du droit d’auteur | “Réflexions de base sur les dispositions flexibles de limitation des droits en réponse à l’avancement de la numérisation et de la mise en réseau”[ja] 

Dans le cas où un accord différent des dispositions du droit d’auteur a été conclu

La loi japonaise sur le droit d’auteur autorise l’utilisation d’œuvres protégées par le droit d’auteur pour l’apprentissage automatique, mais il est également possible de conclure un accord différent entre les parties. Si un tel accord a été conclu, vous pourriez être tenu responsable des dommages et intérêts si vous violez cet accord.

Par exemple, certains sites interdisent explicitement la collecte et l’extraction de données pour l’apprentissage automatique et l’analyse d’informations dans leurs conditions d’utilisation ou leurs conditions de licence. Lors de la collecte de données, il est nécessaire de vérifier les conditions d’utilisation et les conditions de licence du site.

En général, pour “accepter” les conditions d’utilisation d’un site, une certaine action est requise. Par exemple, vous pouvez être invité à créer un compte ou à cliquer sur un bouton d’accord, avec un message indiquant que “en créant un compte, vous êtes considéré comme ayant accepté les conditions d’utilisation et la politique de confidentialité”. En cliquant sur le bouton d’enregistrement ou d’accord, vous “acceptez” les conditions.

D’un autre côté, si les conditions d’utilisation interdisant simplement la collecte et l’extraction de données sont affichées sur une page différente de la page de téléchargement du site, et que vous pouvez télécharger des images sans accepter ces conditions, alors “l’accord” n’est pas conclu. Dans ce cas, les dispositions de la loi japonaise sur le droit d’auteur s’appliquent, et vous pouvez utiliser l’œuvre.

Cependant, pour éviter les problèmes, il est préférable de s’abstenir de collecter des données à partir de sites qui interdisent explicitement la collecte et l’extraction de données dans leurs conditions d’utilisation.

Article connexe : Qu’est-ce que le scraping ? Explication des problèmes juridiques de cette méthode de collecte de données qui attire l’attention[ja]

Les images synthétisées par l’apprentissage automatique violent-elles le droit d’auteur ?

Les images synthétisées par l'apprentissage automatique violent-elles le droit d'auteur ?

Jusqu’à présent, nous avons expliqué que l’utilisation d’œuvres d’art pour l’apprentissage automatique est autorisée par le droit d’auteur japonais. Alors, est-ce que la création d’images synthétisées par l’IA, qui a appris à partir d’images originales (photos, illustrations, peintures, etc.), constitue une violation du droit d’auteur de ces images ?

Ici, nous expliquerons en prenant l’exemple du cas où l’IA génère des images à l’aide de GAN (Generative Adversarial Networks).

Le fonctionnement de la génération d’images par apprentissage automatique

Le GAN (Generative Adversarial Networks) est un type de modèle génératif qui peut générer des données inexistantes ou transformer des données existantes en fonction de leurs caractéristiques, en apprenant à partir de ces données. Le mécanisme de génération d’images par GAN est utilisé, par exemple, dans des services qui analysent des photos ou des peintures de pièces réelles et synthétisent des images comme si des meubles adaptés au budget et à la taille de la pièce étaient réellement placés là.

L’IA peut-elle violer le droit d’auteur de l’image originale à partir de laquelle elle a appris ?

Le GAN est composé de deux réseaux neuronaux, le générateur (Generator) et le discriminateur (Discriminator). Le générateur numérise les caractéristiques de l’image originale, lit ces valeurs, et en entrant une certaine variable, il génère une image synthétisée en produisant une valeur ajustée par cette variable.

En d’autres termes, l’image synthétisée est une image nouvellement générée en tant que résultat de l’entrée d’une variable dans une fonction lors du processus de synthèse, et peut donc être considérée comme totalement différente des données de l’image originale (photos, illustrations, peintures, etc.). Même si une image similaire à l’image originale est synthétisée à la suite de l’apprentissage automatique, cela n’est pas considéré comme une reproduction, une adaptation ou une modification des données d’apprentissage originales.

Par conséquent, on peut dire que les images synthétisées générées par l’IA à travers l’apprentissage automatique ne violent pas le droit d’auteur de l’image originale à partir de laquelle elle a appris.

Article connexe : Comment les droits de propriété intellectuelle sont-ils protégés dans le développement de l’IA ? Organisation des points de discussion sur le droit d’auteur et le droit des brevets[ja]

Résumé : Consultez un avocat pour les questions de droits d’auteur et d’apprentissage automatique de l’IA

Dans cet article, nous avons expliqué les problèmes liés au droit d’auteur lors de l’utilisation d’images publiées en ligne pour l’apprentissage automatique de l’IA.

L’utilisation d’œuvres protégées par le droit d’auteur pour l’apprentissage automatique est autorisée par la loi japonaise sur le droit d’auteur (Article 30-4 de la loi japonaise sur le droit d’auteur). Cependant, il existe des exceptions où l’utilisation d’œuvres n’est pas autorisée, par exemple, lorsque cela porte injustement atteinte aux intérêts du titulaire du droit d’auteur ou lorsque les parties ont convenu de dispositions différentes de celles de la loi sur le droit d’auteur.

Avec l’attention croissante portée à l’IA comme “Midjourney”, “Stable Diffusion”, “ChatGPT”, etc., le nombre d’entreprises se lançant dans le développement de l’IA augmente rapidement. Comme il peut être difficile de déterminer si l’utilisation d’œuvres protégées par le droit d’auteur comme données d’apprentissage est autorisée, nous vous recommandons de consulter un avocat spécialisé dans le domaine de l’IT lorsque vous menez des activités commerciales utilisant l’IA et l’apprentissage automatique.

Présentation des mesures prises par notre cabinet

Le cabinet d’avocats Monolith est un cabinet d’avocats qui possède une riche expérience dans les domaines de l’IT, et en particulier de l’Internet et du droit.

Le secteur de l’IA comporte de nombreux risques juridiques, et le soutien d’avocats experts en questions juridiques liées à l’IA est indispensable. Notre cabinet, avec une équipe d’avocats experts en IA et d’ingénieurs, offre un soutien juridique avancé pour les entreprises de l’IA, y compris ChatGPT, telles que la rédaction de contrats, l’examen de la légalité des modèles d’affaires, la protection des droits de propriété intellectuelle et la gestion de la confidentialité. Les détails sont décrits dans l’article ci-dessous.

Domaines d’intervention du cabinet d’avocats Monolith : Droit de l’IA (ChatGPT, etc.)[ja]

Managing Attorney: Toki Kawase

The Editor in Chief: Managing Attorney: Toki Kawase

An expert in IT-related legal affairs in Japan who established MONOLITH LAW OFFICE and serves as its managing attorney. Formerly an IT engineer, he has been involved in the management of IT companies. Served as legal counsel to more than 100 companies, ranging from top-tier organizations to seed-stage Startups.

Retourner En Haut