Verstößt das Crawlen von Bildern im Internet gegen das Urheberrecht? Eine Erklärung der rechtlichen Probleme beim maschinellen Lernen
In den letzten Jahren sind die Fortschritte in der AI (Künstliche Intelligenz) Technologie bemerkenswert. Verschiedene AI-Systeme, wie die Bildgenerierungs-AI “Stable Diffusion” und “Midjourney”, sowie Textgenerierungs-AI wie “ChatGPT”, ziehen viel Aufmerksamkeit auf sich. Durch das Crawlen von Daten im Internet und das Lernen durch AI ist es möglich, eine Vielzahl von Aufgaben mit AI zu erledigen. Während die Genauigkeit des maschinellen Lernens verbessert wird, wird das Risiko von Urheberrechtsverletzungen hervorgehoben.
Stellt das Crawlen und Sammeln von verschiedenen Daten, wie Bildern und Illustrationen, die im Internet veröffentlicht werden, ohne Erlaubnis und deren Verwendung für das maschinelle Lernen von AI, eine Verletzung des Urheberrechts dar?
In diesem Artikel werden wir die rechtlichen Probleme erläutern, die sich aus der Verwendung von im Internet veröffentlichten Bildern und Illustrationen für das maschinelle Lernen ergeben.
Was ist maschinelles Lernen?
Maschinelles Lernen (ML: Machine Learning) bezeichnet den Prozess, bei dem Maschinen ähnlich wie Menschen aus Erfahrungen lernen, in diesem Fall aus Daten. Im Prozess des maschinellen Lernens ist es notwendig, Daten zu sammeln, diese auszuwählen und zu verarbeiten, um einen Datensatz für das Lernen zu erstellen.
Das Crawling bezeichnet den Prozess, bei dem ein Programm, das als Crawler bezeichnet wird, Websites durchsucht und Informationen wie Texte und Bilder von Webseiten kopiert und speichert.
Verwandter Artikel: Was ist Scraping? Wir erklären die rechtlichen Herausforderungen dieser praktischen Methode zur Datensammlung
Urheberrechtsprobleme im Maschinenlernen
“Urheberrecht” bezeichnet einfach gesagt das Recht, ein Werk rechtlich zu schützen. Und die “Werke”, die geschützt werden, sind im Artikel 2 Absatz 1 des japanischen Urheberrechtsgesetzes (Japanisches Urheberrechtsgesetz) wie folgt definiert:
(Definition)
Artikel 2 In diesem Gesetz haben die in den folgenden Nummern aufgeführten Begriffe die dort festgelegte Bedeutung.
1. Werk: Etwas, das Gedanken oder Gefühle kreativ ausdrückt und in den Bereich der Literatur, Wissenschaft, Kunst oder Musik fällt.
Hintergrund der Urheberrechtsänderung im Jahr 2018 (Heisei 30)
Im Jahr 2018 (Heisei 30) wurde das geänderte Urheberrechtsgesetz verabschiedet und trat am 1. Januar 2019 (Heisei 31) in Kraft.
Um Technologien wie IoT, Big Data und KI (Künstliche Intelligenz) zu nutzen, ist es notwendig, die Akkumulation, Kombination und Analyse von großen Mengen an Informationen, einschließlich urheberrechtlich geschützter Werke, zu ermöglichen. Daher wurde in dieser Änderung eine Bestimmung eingeführt, die die Nutzung von urheberrechtlich geschützten Werken in bestimmten Fällen, wie z.B. wenn sie nicht zum Zwecke der Betrachtung genutzt werden, zulässt.
Was ist die Nutzung, die im Artikel 30 Absatz 4 des Urheberrechtsgesetzes erlaubt ist?
Im Jahr 2018 wurde im Artikel 30 Absatz 4 des geänderten Urheberrechtsgesetzes festgelegt, dass die “Nutzung, die nicht auf den Genuss von Gedanken oder Gefühlen abzielt, die in einem Werk ausgedrückt werden”, in dem als notwendig anerkannten Umfang und unabhängig von der Methode erlaubt ist.
(Nutzung, die nicht auf den Genuss von Gedanken oder Gefühlen abzielt, die in einem Werk ausgedrückt werden)
Artikel 30 Absatz 4 Ein Werk kann in den folgenden Fällen und in anderen Fällen, in denen es nicht beabsichtigt ist, die in dem Werk ausgedrückten Gedanken oder Gefühle selbst zu genießen oder anderen zu ermöglichen, sie zu genießen, in dem als notwendig anerkannten Umfang und unabhängig von der Methode genutzt werden. Dies gilt jedoch nicht, wenn dies unter Berücksichtigung der Art und des Zwecks des Werks und der Art der Nutzung die Interessen des Urheberrechtsinhabers ungerechtfertigt beeinträchtigt.
1. Wenn es für Tests zur Entwicklung oder praktischen Anwendung von Technologien zur Aufnahme, Aufzeichnung oder sonstigen Nutzung von Werken verwendet wird
2. Wenn es für Informationsanalysen (das Extrahieren von Informationen über die Elemente, die die Sprache, den Ton, das Bild usw. der Informationen aus einer großen Menge von Werken und anderen Informationen bilden, und das Durchführen von Vergleichen, Klassifizierungen und anderen Analysen. Das Gleiche gilt für Artikel 47 Absatz 5 Nummer 2.) verwendet wird
3. In Fällen, die nicht unter den vorherigen zwei Nummern fallen, wenn das Werk ohne menschliche Wahrnehmung der Ausdrucksform des Werks in einem Prozess der Informationsverarbeitung durch einen Computer oder in einer anderen Nutzung (mit Ausnahme der Ausführung des Werks in einem Computer im Falle von Computerprogrammen) verwendet wird
Konkret sind folgende Fälle erlaubt, in denen urheberrechtlich geschützte Werke genutzt werden können:
・Das Testen der Reproduktion von Kunstwerken zur Entwicklung von Kameras oder Druckern, die für die Reproduktion von Kunstwerken geeignet sind
・Das Sammeln und Nutzen von urheberrechtlich geschützten Werken als Lernmaterial für die Entwicklung von Künstlicher Intelligenz, oder das Bereitstellen (Übertragen oder öffentlich Übertragen usw.) von gesammelten Lernmaterialien für Dritte unter dem Ziel der Entwicklung von Künstlicher Intelligenz
・Das Kopieren von urheberrechtlich geschützten Werken im Hintergrund während des Informationsverarbeitungsprozesses eines Computers und die Nutzung dieser Daten, ohne dass Menschen sie überhaupt wahrnehmen
・Die Nutzung von Computerprogrammen für die Untersuchung und Analyse von Programmen (sogenanntes “Reverse Engineering”)
Fälle, in denen die Nutzung von urheberrechtlich geschützten Werken für maschinelles Lernen zu Urheberrechtsverletzungen führen kann
Wie bereits erwähnt, ist es erlaubt, Bilder (urheberrechtlich geschützte Werke) für maschinelles Lernen zu sammeln, zu bearbeiten und zu nutzen, und auch die von Ihnen gesammelten Trainingsdaten an Dritte zu liefern (zu verkaufen oder zu übertragen) gemäß Artikel 30 Absatz 4 Nr. 2 des japanischen Urheberrechtsgesetzes (Japanese Copyright Law). Es besteht jedoch die Möglichkeit, dass die Nutzung solcher Werke zu rechtlichen Problemen führen kann.
Lassen Sie uns die rechtlichen Probleme untersuchen, die auftreten können, wenn Sie Bilder, die online veröffentlicht wurden, sammeln und für maschinelles Lernen nutzen.
Verwandter Artikel: Wie weit können Informationen aus dem Internet genutzt werden? Erklärung des Urheberrechts im Internet
Wenn die Interessen des Urheberrechtsinhabers ungerechtfertigt beeinträchtigt werden
Artikel 30 Absatz 4 des japanischen Urheberrechtsgesetzes (Japanese Copyright Law) erlaubt die Nutzung von Werken, die nicht zum Zweck der “Genuss von Gedanken oder Gefühlen, die in Werken ausgedrückt werden”, vorgesehen sind, erlaubt jedoch nicht die Nutzung von Werken, wenn diese die Interessen des Urheberrechtsinhabers ungerechtfertigt beeinträchtigen.
Welche spezifischen Fälle könnten in Betracht gezogen werden? Laut den Q&A der Agentur für kulturelle Angelegenheiten gelten die folgenden Fälle als “Fälle, in denen die Interessen des Urheberrechtsinhabers ungerechtfertigt beeinträchtigt werden”.
Obwohl die endgültige Entscheidung in einem Gerichtsverfahren getroffen wird, wird angenommen, dass beispielsweise das Kopieren einer Datenbank, die eine große Menge an Informationen in einer Form organisiert, die leicht für die Informationsanalyse genutzt werden kann, und die zum Verkauf angeboten wird, für den Zweck der Informationsanalyse als “Fall, in dem die Interessen des Urheberrechtsinhabers ungerechtfertigt beeinträchtigt werden”, da sie mit dem Markt für den Verkauf der betreffenden Datenbank in Konflikt steht.
Zitat: Abteilung für Urheberrecht der Agentur für kulturelle Angelegenheiten | “Grundlegende Überlegungen zur flexiblen Beschränkung der Rechte im Hinblick auf die Fortschritte bei der Digitalisierung und Vernetzung”
Wenn eine Vereinbarung getroffen wird, die von den Bestimmungen des Urheberrechtsgesetzes abweicht
Obwohl das japanische Urheberrechtsgesetz (Japanese Copyright Law) die Nutzung von urheberrechtlich geschützten Werken für maschinelles Lernen erlaubt, können die Parteien eine Vereinbarung treffen, die von dieser Regelung abweicht. Wenn eine solche Vereinbarung getroffen wurde und diese Vereinbarung verletzt wird, können Sie möglicherweise für Schadenersatz haftbar gemacht werden.
Zum Beispiel gibt es Websites, die in ihren Nutzungsbedingungen oder Lizenzvereinbarungen ausdrücklich das Sammeln und Extrahieren von Daten für maschinelles Lernen oder Informationsanalyse verbieten. Wenn Sie Daten sammeln, müssen Sie die Nutzungsbedingungen und Lizenzvereinbarungen der Website überprüfen.
Im Allgemeinen wird von Ihnen erwartet, dass Sie eine “Vereinbarung” mit den Nutzungsbedingungen der Website treffen, indem Sie eine bestimmte Aktion durchführen. Zum Beispiel werden Sie aufgefordert, sich zu registrieren oder einen Zustimmungsbutton zu drücken, zusammen mit einer Anzeige wie “Durch das Erstellen eines Kontos stimmen Sie den Nutzungsbedingungen und der Datenschutzrichtlinie zu”. Durch das Klicken auf die Registrierung oder den Zustimmungsbutton wird die “Vereinbarung” getroffen.
Andererseits, wenn die Nutzungsbedingungen, die das Sammeln und Extrahieren von Daten verbieten, nur auf einer anderen Seite als der Download-Seite der Website angezeigt werden und Sie Bilder herunterladen können, ohne zuzustimmen, wird davon ausgegangen, dass keine “Vereinbarung” getroffen wurde. In diesem Fall gelten die Bestimmungen des Urheberrechtsgesetzes und Sie dürfen das urheberrechtlich geschützte Werk nutzen.
Dennoch, um Probleme zu vermeiden, sollten Sie es vermeiden, Daten von Websites zu sammeln, die in ihren Nutzungsbedingungen ausdrücklich das Sammeln und Extrahieren von Daten verbieten.
Verwandter Artikel: Was ist Scraping? Erklärung der rechtlichen Fragen rund um diese beliebte Methode zur Datensammlung
Verstößt ein durch maschinelles Lernen erstelltes Bild gegen das Urheberrechtsgesetz?
Bisher haben wir erklärt, dass die Nutzung von urheberrechtlich geschützten Werken für maschinelles Lernen im japanischen Urheberrechtsgesetz (Japanisches Urheberrechtsgesetz) anerkannt ist. Aber stellt die Erstellung von synthetischen Bildern durch KI, die maschinelles Lernen durchführt, eine Verletzung des Urheberrechts der ursprünglichen Bilder (Fotos, Illustrationen, Gemälde usw.) dar, die als Lerngrundlage dienten?
Hier erklären wir dies am Beispiel eines Falles, in dem KI Bilder mit GAN (Generative Adversarial Networks) erzeugt.
Wie Bilder durch maschinelles Lernen erzeugt werden
GAN (Generative Adversarial Networks) ist ein generatives Modell, das durch das Lernen von Merkmalen aus Daten nicht existierende Daten erzeugen oder vorhandene Daten entsprechend ihren Merkmalen transformieren kann. Dieses Prinzip der Bildgenerierung durch GAN wird beispielsweise in Diensten verwendet, die Bilder von tatsächlichen Räumen oder Gemälden analysieren und Bilder synthetisieren, als ob Möbel, die auf das Budget oder die Größe des Raumes abgestimmt sind, tatsächlich dort platziert wären.
Kann KI das Urheberrecht der ursprünglichen Bilder, die sie gelernt hat, verletzen?
GAN besteht aus zwei neuronalen Netzwerken, dem Generator und dem Diskriminator. Der Generator numerisiert die Merkmale des ursprünglichen Bildes und liest sie ab. Durch Eingabe einer bestimmten Variablen erzeugt er ein synthetisiertes Bild, das einen durch diese Variable angepassten numerischen Wert ausgibt.
Das bedeutet, dass das synthetisierte Bild ein völlig neues Bild ist, das als Ergebnis der Eingabe einer Variablen in eine Funktion während des Syntheseprozesses erzeugt wurde, und es ist völlig anders als die ursprünglichen Bilddaten (Fotos, Illustrationen, Gemälde usw.). Selbst wenn als Ergebnis des maschinellen Lernens ein Bild erzeugt wird, das dem ursprünglichen Bild ähnelt, wird dies nicht als Duplikation, Adaption oder Modifikation der ursprünglichen Lern-Daten angesehen.
Daher kann man sagen, dass ein auf diese Weise durch maschinelles Lernen von KI erzeugtes synthetisiertes Bild das Urheberrecht des ursprünglichen Bildes, das für das maschinelle Lernen verwendet wurde, nicht verletzt.
Verwandter Artikel: Wie wird das geistige Eigentum bei der KI-Entwicklung geschützt? Eine Zusammenfassung der Diskussionspunkte zu Urheberrechten und Patenten
Zusammenfassung: Konsultieren Sie einen Anwalt bei Fragen zu KI-Maschinenlernen und Urheberrecht
In diesem Artikel haben wir die urheberrechtlichen Probleme erläutert, die sich ergeben, wenn Bilder, die im Internet veröffentlicht wurden, für das maschinelle Lernen von KI verwendet werden.
Die Nutzung von urheberrechtlich geschützten Werken für das maschinelle Lernen ist nach dem japanischen Urheberrechtsgesetz (Artikel 30 Absatz 4 des japanischen Urheberrechtsgesetzes) zulässig. Es gibt jedoch Ausnahmen, in denen die Nutzung von urheberrechtlich geschützten Werken nicht zulässig ist, beispielsweise wenn dies die Interessen des Urheberrechtsinhabers unangemessen beeinträchtigt oder wenn die Parteien eine Vereinbarung getroffen haben, die von den Bestimmungen des Urheberrechtsgesetzes abweicht.
AI-Technologien wie “Midjourney”, “Stable Diffusion” und “ChatGPT” ziehen viel Aufmerksamkeit auf sich, und immer mehr Unternehmen steigen in die Entwicklung von KI ein. Da es manchmal schwierig sein kann zu beurteilen, ob die Nutzung von urheberrechtlich geschützten Werken als Lernmaterial für die KI-Entwicklung zulässig ist, empfehlen wir Ihnen, einen Anwalt zu konsultieren, der sich mit IT auskennt, wenn Sie ein Geschäft betreiben, das KI und maschinelles Lernen nutzt.
Maßnahmen unserer Kanzlei
Die Monolith Rechtsanwaltskanzlei ist eine Kanzlei mit umfangreicher Erfahrung in beiden Bereichen, IT und insbesondere Internetrecht.
Das AI-Geschäft birgt viele rechtliche Risiken und erfordert die Unterstützung von Anwälten, die mit rechtlichen Fragen im Zusammenhang mit AI vertraut sind. Unser Team, bestehend aus Anwälten und Ingenieuren, die sich mit AI auskennen, bietet hochwertige rechtliche Unterstützung für AI-Geschäfte, einschließlich ChatGPT. Dazu gehören die Erstellung von Verträgen, die Überprüfung der Rechtmäßigkeit von Geschäftsmodellen, der Schutz von geistigem Eigentum und die Einhaltung von Datenschutzbestimmungen. Weitere Details finden Sie in den untenstehenden Artikeln.
Bereiche, in denen die Monolith Rechtsanwaltskanzlei tätig ist: AI (ChatGPT usw.) Recht
Category: IT