O rastreamento de imagens na internet viola a lei de direitos autorais? Explicação dos problemas legais da aprendizagem automática
Nos últimos anos, o progresso da tecnologia AI (Inteligência Artificial) tem sido notável, com várias IA como a “Stable Diffusion” e “Midjourney”, que geram imagens, e a “ChatGPT”, que gera textos, a atrair atenção. Ao fazer a varredura de dados na internet para ensinar à IA, torna-se possível fazer várias coisas usando IA, e enquanto a precisão do aprendizado de máquina está a melhorar, o risco de violação dos direitos de autor está a ser apontado.
Coletar e processar sem permissão vários dados, como imagens e ilustrações publicadas na internet, para uso no aprendizado de máquina da IA, será que isso não infringe os direitos de autor?
Neste artigo, explicaremos os problemas legais de usar imagens e ilustrações publicadas na internet para aprendizado de máquina.
O que é Aprendizagem Automática
Aprendizagem Automática (ML: Machine Learning) é o processo pelo qual as máquinas aprendem a partir de dados, de forma semelhante à maneira como os humanos aprendem com a experiência. No processo de aprendizagem automática, é necessário coletar dados, selecionar e processar esses dados para criar um conjunto de dados para aprendizagem.
O crawling é um processo em que um programa chamado crawler percorre sites, copiando e armazenando informações como texto e imagens encontradas nas páginas da web.
Artigo relacionado: O que é scraping? Explicação dos desafios legais de um método conveniente de coleta de dados que está atraindo atenção[ja]
Problemas na lei de direitos autorais no aprendizado de máquina
“Direitos autorais”, de forma simples, refere-se ao direito de proteger legalmente as obras. E as “obras” protegidas são definidas no Artigo 2, Parágrafo 1 da Lei de Direitos Autorais Japonesa (Lei Japonesa de Direitos Autorais) da seguinte maneira:
(Definição)
Artigo 2 Nesta lei, o significado dos termos listados nos seguintes itens será conforme estabelecido em cada item.
1. Obra: Refere-se a algo que expressa criativamente pensamentos ou sentimentos e pertence ao campo da literatura, ciência, arte ou música.
Contexto da revisão da Lei de Direitos Autorais em 2018 (Ano 30 da era Heisei)
Em 2018 (Ano 30 da era Heisei), a Lei de Direitos Autorais foi revisada e entrou em vigor em 1º de janeiro de 2019 (Ano 31 da era Heisei).
Para aproveitar tecnologias como IoT, Big Data e IA (Inteligência Artificial), é necessário permitir o acúmulo, combinação e análise de grandes quantidades de informações, incluindo obras. Portanto, nesta revisão, foi estabelecida uma disposição que permite o uso de obras em certos casos, como quando não são usadas para fins de apreciação.
O que é permitido pelo Artigo 30-4 da Lei de Direitos Autorais
Na revisão de 2018 do Artigo 30-4 da Lei de Direitos Autorais, foi permitido o uso de obras “sem o objetivo de desfrutar dos pensamentos ou sentimentos expressos na obra”, na medida necessária, independentemente do método.
(Uso sem o objetivo de desfrutar dos pensamentos ou sentimentos expressos na obra)
Artigo 30-4 As obras podem ser usadas, na medida considerada necessária, de qualquer maneira, nos casos listados abaixo e em outros casos em que o objetivo não seja desfrutar dos pensamentos ou sentimentos expressos na obra por si mesmo ou permitir que outros o façam. No entanto, isso não se aplica se, considerando o tipo e o uso da obra e a maneira como é usada, prejudicar injustamente os interesses do titular dos direitos autorais.
1. Quando usado para testes para o desenvolvimento ou a prática de tecnologia relacionada à gravação, filmagem ou outro uso de obras
2. Quando usado para análise de informações (refere-se à extração de informações relacionadas a elementos de linguagem, som, imagem, etc. que compõem as informações de um grande número de obras e outras grandes quantidades de informações, e à realização de comparação, classificação e outras análises. O mesmo se aplica no item 2 do parágrafo 1 do artigo 47-5.)
3. Além dos casos listados nos dois itens anteriores, quando a obra é usada no processo de processamento de informações por computador ou outro uso (excluindo a execução da obra do programa em um computador no caso de obras de programa) sem o reconhecimento humano da expressão da obra
Em termos concretos, o uso de obras é permitido nos seguintes casos:
・Ato de reproduzir obras de arte de forma experimental para desenvolver câmeras ou impressoras adequadas para a reprodução de obras de arte
・Ato de coletar e usar obras como dados de treinamento para o desenvolvimento de IA, ou fornecer (transferir ou transmitir publicamente, etc.) os dados de treinamento coletados a terceiros sob o objetivo de desenvolvimento de IA
・Ato de copiar obras no back-end do processamento de informações do computador e usar esses dados sem qualquer percepção humana
・Ato de usar obras de programas para fins de pesquisa e análise de programas (o chamado “engenharia reversa”)
Casos em que o uso de obras protegidas por direitos autorais na aprendizagem de máquina pode violar a lei de direitos autorais
Assim, coletar, processar e usar imagens (obras protegidas por direitos autorais) para aprendizagem de máquina, bem como fornecer (vender, transferir, etc.) os dados de aprendizagem coletados a terceiros, é permitido sob o Artigo 30-4, Parágrafo 2, da Lei Japonesa de Direitos Autorais. No entanto, o uso de tais obras protegidas por direitos autorais pode levar a problemas legais.
Vamos considerar os problemas legais que podem surgir ao coletar imagens disponíveis na internet para uso na aprendizagem de máquina.
Artigo relacionado: Até que ponto as informações na internet podem ser usadas? Explicação sobre direitos autorais na internet[ja]
Quando prejudica injustamente os interesses do titular dos direitos autorais
O Artigo 30-4 da Lei Japonesa de Direitos Autorais permite o “uso que não tem como objetivo o gozo de pensamentos ou sentimentos expressos na obra”, mas não permite o uso da obra se prejudicar injustamente os interesses do titular dos direitos autorais.
Que tipo de casos concretos podemos considerar? De acordo com o Q&A da Agência de Assuntos Culturais, os seguintes casos são considerados “casos que prejudicam injustamente os interesses do titular dos direitos autorais”.
A decisão concreta é finalmente tomada em tribunal, mas, por exemplo, se uma obra de banco de dados que organiza uma grande quantidade de informações de forma a ser facilmente utilizada para análise de informações estiver à venda, a ação de copiar essa base de dados para fins de análise de informações pode ser considerada como “prejudicando injustamente os interesses do titular dos direitos autorais”, pois entra em conflito com o mercado de venda da base de dados.
Citação: Agência de Assuntos Culturais, Divisão de Direitos Autorais | “Pensamento básico sobre a provisão flexível de limitações de direitos em resposta ao avanço da digitalização e da rede”[ja]
Quando um acordo diferente das disposições da lei de direitos autorais é feito
A Lei Japonesa de Direitos Autorais permite o uso de obras protegidas por direitos autorais na aprendizagem de máquina, mas também é possível fazer um acordo diferente entre as partes. Se tal acordo for estabelecido, você pode ser responsabilizado por danos se violar o acordo.
Por exemplo, existem sites que proíbem explicitamente a coleta e extração de dados para aprendizagem de máquina e análise de informações em seus termos de uso e contratos de licença. Ao coletar dados, é necessário verificar os termos de uso e os contratos de licença do site.
Em geral, para “concordar” com os termos de uso de um site, é necessário algum tipo de ação. Por exemplo, ao criar uma conta, você é considerado como tendo concordado com os termos de uso e a política de privacidade, e é solicitado que você se registre ou clique no botão de concordância. Ao clicar no botão de registro ou concordância, o “acordo” é estabelecido.
Por outro lado, se os termos de uso que proíbem a coleta e extração de dados forem postados em uma página diferente da página de download no site, e você puder baixar as imagens sem concordar com eles, o “acordo” não será estabelecido. Neste caso, as disposições da Lei Japonesa de Direitos Autorais se aplicam, e você pode usar a obra protegida por direitos autorais.
No entanto, para prevenir problemas, é melhor evitar coletar dados de sites que proíbem explicitamente a coleta e extração de dados em seus termos de uso.
Artigo relacionado: O que é scraping? Explicação dos problemas legais do método conveniente de coleta de dados que está atraindo atenção[ja]
As imagens sintetizadas por aprendizagem automática violam a lei de direitos autorais?
Até agora, explicamos que o uso de obras protegidas por direitos autorais na aprendizagem automática é permitido pela lei de direitos autorais. Mas será que a criação de imagens sintetizadas por AI, após a aprendizagem automática, infringe os direitos autorais das imagens originais (fotografias, ilustrações, pinturas, etc.) que serviram de base para a aprendizagem?
Aqui, vamos explicar usando como exemplo o caso em que a AI gera imagens através de GAN (Redes Adversárias Generativas).
Como funciona a geração de imagens por aprendizagem automática
GAN (Redes Adversárias Generativas) é um tipo de modelo generativo que pode criar dados inexistentes ou transformar dados existentes de acordo com as suas características, aprendendo a partir dos dados. Este mecanismo de geração de imagens por GAN é utilizado, por exemplo, em serviços que sintetizam imagens como se os móveis estivessem realmente colocados num quarto, de acordo com o orçamento e o tamanho do quarto, analisando fotografias ou desenhos de quartos reais.
A AI pode infringir os direitos autorais das imagens originais a partir das quais aprendeu?
O GAN é composto por duas redes neurais, o Gerador (Generator) e o Discriminador (Discriminator). O Gerador lê as características da imagem original em forma numérica e, ao inserir uma certa variável, gera uma imagem sintetizada, produzindo um valor numérico ajustado por essa variável.
Portanto, a imagem sintetizada é uma imagem completamente nova, gerada como resultado da inserção de uma variável na função durante o processo de síntese, e pode ser considerada completamente diferente dos dados da imagem original (fotografias, ilustrações, pinturas, etc.). Mesmo que, como resultado da aprendizagem automática, uma imagem semelhante à original seja sintetizada, isso não é considerado uma cópia, adaptação ou modificação dos dados de aprendizagem originais.
Portanto, pode-se dizer que as imagens sintetizadas geradas pela AI através da aprendizagem automática não infringem os direitos autorais das imagens originais a partir das quais a AI aprendeu.
Artigo relacionado: Como são protegidos os direitos de propriedade intelectual no desenvolvimento de AI? Organizando os pontos de discussão sobre direitos autorais e patentes[ja]
Resumo: Consulte um advogado sobre questões de direitos autorais e aprendizado de máquina de IA
Neste artigo, discutimos os problemas legais relacionados ao uso de imagens publicadas online para o aprendizado de máquina de IA.
O uso de obras protegidas por direitos autorais para aprendizado de máquina é permitido pela lei de direitos autorais (Artigo 30, parágrafo 4, da Lei de Direitos Autorais Japonesa). No entanto, excepcionalmente, existem casos em que o uso de obras protegidas por direitos autorais não é permitido se prejudicar injustamente os interesses do titular dos direitos autorais ou se houver um acordo entre as partes que difere das disposições da lei de direitos autorais.
Com a crescente atenção para a IA, como “Midjourney”, “Stable Diffusion” e “ChatGPT”, o número de empresas que embarcam no desenvolvimento de IA está a aumentar rapidamente. Como o uso de obras protegidas por direitos autorais como dados de treinamento indispensáveis para o desenvolvimento de IA pode ser difícil de determinar, recomendamos que consulte um advogado especializado em TI ao conduzir negócios que utilizem IA e aprendizado de máquina.
Apresentação das medidas propostas pelo nosso escritório
O Escritório de Advocacia Monolith é um escritório de advocacia com vasta experiência em IT, especialmente na intersecção entre a Internet e a lei.
O negócio de IA envolve muitos riscos legais, e o apoio de advogados familiarizados com questões legais relacionadas à IA é essencial. A nossa equipa, composta por advogados especializados em IA e engenheiros, oferece suporte jurídico avançado para negócios de IA, incluindo ChatGPT, como a criação de contratos, a avaliação da legalidade dos modelos de negócios, a proteção dos direitos de propriedade intelectual e a conformidade com a privacidade. Detalhes são fornecidos no artigo abaixo.
Áreas de atuação do Escritório de Advocacia Monolith: Assuntos jurídicos de IA (ChatGPT, etc.)[ja]
Category: IT