A geração de "vozes" através de IA pode constituir uma violação de direitos autorais? (#2 Edição de Geração e Utilização)

Com o desenvolvimento da tecnologia de IA geradora, tornou-se possível aprender e gerar facilmente a “voz” de cantores e atores de voz reais. No cenário empresarial, em contextos como o desenvolvimento de aplicações, jogos e criação de animações, é possível ensinar à IA geradora essas “vozes” e gerar novas “vozes”.
Ensinar à IA geradora a “voz” de cantores e atores de voz reais e gerar novas “vozes” pode constituir uma violação de direitos autorais ou outras infrações legais no Japão. Na verdade, a interpretação dessas questões ainda não está claramente definida na legislação japonesa atual.
Aqui, explicaremos a possibilidade de violação de direitos autorais, direitos conexos e direitos de publicidade nas fases de geração e uso de IA geradora sob a lei japonesa. Os problemas legais na fase de desenvolvimento e aprendizagem são explicados neste artigo (#1 Fase de Desenvolvimento e Aprendizagem)[ja]. Convidamo-lo a consultar também esse conteúdo.
Três Padrões de Utilização nas Fases de Geração e Uso
Dizer apenas “gerar vozes com IA de geração” é simplificar demasiado, pois o processo deve ser dividido nas seguintes duas fases:
- Fase de desenvolvimento e aprendizagem
- Fase de geração e uso
A primeira é realizada pelos desenvolvedores de IA, enquanto a segunda é usualmente realizada pelos utilizadores de IA.
Quando esquematizamos estes processos, o resultado é o seguinte:

Na fase de desenvolvimento e aprendizagem, são coletados e acumulados dados originais de vozes humanas como dados de aprendizagem para o desenvolvimento de IA, criando-se conjuntos de dados de aprendizagem. Posteriormente, esses conjuntos de dados são inseridos na IA para realizar a aprendizagem automática e criar um modelo já treinado. Estas tarefas são normalmente realizadas pelos desenvolvedores de IA.
Na fase de geração e uso, dados originais são inseridos numa IA de geração que já completou a aprendizagem automática, produzindo e utilizando os artefatos gerados pela IA. Estas tarefas são normalmente realizadas pelos utilizadores de IA.
Quanto aos padrões de utilização na fase de geração e uso, podemos prever os seguintes três padrões:
- Padrão 1: Inserir uma voz humana na IA para gerar um artefato de IA diferente dos dados de voz originais
- Padrão 2: Inserir uma voz humana na IA para gerar um artefato de IA idêntico ou semelhante aos dados de voz originais
- Padrão 3: Inserir dados que não são de voz humana na IA para gerar um artefato de IA idêntico ou semelhante à voz de uma pessoa real
A seguir, explicaremos brevemente que tipos de violações de direitos podem ser potencialmente causadas por cada um desses padrões de utilização.
Padrão 1: Inserção de Vozes Humanas em IA para Gerar Produtos Diferentes dos Dados de Voz Originais

Primeiramente, vamos explicar as possíveis infrações de direitos que podem ocorrer quando se insere a voz de uma pessoa numa IA para gerar um produto diferente dos dados de voz originais.
Relação com os Direitos Autorais
Para o Padrão 1, imagine, especificamente, a inserção de dados de voz de um cantor específico numa IA capaz de identificar a voz de qualquer cantor ou a inserção simultânea da voz de um cantor específico e a voz do usuário da IA para gerar dados de voz que soem como se fossem do cantor em questão.
No que diz respeito aos direitos autorais, a questão surge quando se insere uma obra existente na IA. Tal ato pode ser considerado “análise de informação” (Artigo 30-4, Número 2 da Lei de Direitos Autorais), e, portanto, é permitido usar a obra de qualquer maneira necessária para essa análise de informação, dentro dos limites reconhecidos como necessários. Assim, se a inserção for necessária para a análise de informação, não constituirá uma violação dos direitos autorais, desde que seja dentro dos limites necessários.
Relação com os Direitos Conexos
Em relação aos direitos conexos, o Artigo 102 aplica as disposições dos direitos autorais do Artigo 30-4, portanto, a inserção mencionada acima não constitui, em princípio, uma violação dos direitos conexos.
Relação com os Direitos de Publicidade
No caso do Padrão 1, vamos supor que a voz inserida pertença a uma celebridade específica. Se os dados de voz de uma celebridade específica forem usados, e se o caso se enquadrar em um dos três tipos de infração explicados na Primeira Parte (#1 Fase de Desenvolvimento e Aprendizado)[ja], então a ação constituirá uma violação dos direitos de publicidade e será considerada um ato ilícito.
Contudo, mesmo que a voz inserida pertença a uma celebridade específica, se a utilização dos dados de voz se limitar à inserção e análise pela IA geradora, não se enquadra nos três tipos de infração mencionados.
Portanto, pode-se dizer que não há margem para violação dos direitos de publicidade nesse uso específico.
Padrão 2: Inserção de Voz Humana em IA para Gerar Dados Idênticos ou Similares
O Padrão 2 consiste em inserir dados de voz de um cantor específico, juntamente com os dados da letra e melodia, numa IA para gerar dados de voz cantando a mesma letra e melodia com a voz desse cantor. Este processo divide-se essencialmente em três etapas:
- Inserção dos dados de voz na IA;
- Geração de obras pela IA com base nesses dados;
- Utilização das obras geradas pela IA.
Com base nestas etapas, vamos analisar a relação com os seguintes direitos:
Relação com os Direitos de Autor
Em relação aos direitos de autor, todas as três etapas – inserção, geração e utilização – podem constituir atos de infração aos direitos de autor.
Primeiro, quanto à inserção. Tal como no Padrão 1, em princípio, o ato de inserção não constitui uma violação dos direitos de autor de acordo com o Artigo 30-4 da lei japonesa. No entanto, existe uma exceção importante a este princípio. Se o objetivo for gerar uma obra de IA que possua as características essenciais da expressão dos dados originais (com o propósito de expressão de saída), o Artigo 30-4 não se aplica e o ato torna-se ilegal. No caso do Padrão 2, o propósito de expressão de saída é frequentemente afirmado, o que significa que a probabilidade de violação dos direitos de autor é alta.
Em seguida, quanto à geração. No caso do Padrão 2, como são gerados dados idênticos ou similares a uma obra de autor existente, isso constitui uma violação do direito de reprodução (Artigo 21), o que aumenta a probabilidade de violação dos direitos de autor.
Por último, quanto à utilização. A utilização de obras idênticas ou similares às existentes, geradas na etapa 2, constitui uma violação do direito de reprodução (Artigo 21) ou do direito de transmissão ao público (Artigo 23), o que significa que a probabilidade de violação dos direitos de autor é alta.
Relação com os Direitos Conexos
Quanto aos direitos conexos, a questão é ainda complexa e não totalmente definida na prática, exigindo análise.
Atualmente, de acordo com o Artigo 102, as disposições dos direitos de autor, como o Artigo 30-4, são aplicadas por analogia, o que significa que a probabilidade de violação dos direitos conexos é geralmente baixa.
Relação com o Direito de Publicidade
Entre as etapas de 1 a 3, as etapas 1 e 2 – inserção e geração – geralmente não se enquadram nas três categorias de violação do direito de publicidade, deixando pouco espaço para infração.
Contudo, no que diz respeito à etapa 3 – utilização – se o método de utilização envolver uso comercial, como vendas, então é provável que se enquadre nas três categorias de violação do direito de publicidade, aumentando a possibilidade de infração.
Padrão 3: Inserção de Dados Não-Vocais em IA para Gerar Dados Idênticos ou Similares a Vozes de Pessoas Reais

Relação com os Direitos Autorais
O Padrão 3 refere-se à prática de inserir o nome de um dublador específico em uma IA para gerar dados de voz de falas desse dublador. A questão central é se os produtos gerados pela IA dependem de obras autorais existentes.
Em conclusão, se o utilizador da IA estiver ciente de uma obra autoral existente e usar a IA com a intenção de gerar um produto idêntico ou similar a essa obra, a dependência é assumida e a visão predominante é que existe uma relação de dependência.
Por exemplo, se um utilizador da IA gera um produto com a intenção de imitar a voz de um dublador específico para fins de restrição, esse caso se enquadra nesta categoria. Portanto, em tais circunstâncias, é provável que haja uma violação dos direitos autorais.
Relação com os Direitos Conexos
Mesmo que a IA seja usada para gerar uma performance idêntica ou similar a uma performance existente, tal ato não é considerado uma “gravação” da performance existente, portanto, não constitui uma violação dos direitos conexos.
Relação com os Direitos de Publicidade
Em relação aos direitos de publicidade, problemas surgem quando a voz gerada é usada comercialmente. Na prática, podem ser considerados vários casos específicos, mas basta compreender a conclusão principal.
Em conclusão, se o utilizador da IA gera intencionalmente uma voz idêntica ou similar à de uma celebridade e usa essa voz gerada, há uma violação dos direitos de publicidade. Casos em que a voz é gerada sem intenção são mais complexos e ainda sujeitos a debate na prática, portanto, serão omitidos neste artigo.
Conclusão: Consulte um especialista sobre a relação entre IA gerativa e direitos autorais
Até agora, explicámos com base em casos concretos os direitos legais associados à voz humana e as ações que podem constituir problemas ao utilizá-los.
Quanto aos direitos legais da voz humana, é crucial considerar separadamente o “conteúdo” e o “som”, bem como ter em mente os direitos autorais, os direitos conexos e o direito de publicidade.
Em relação às ações problemáticas, é necessário focar em quais aspetos específicos estão a causar problemas. A geração de vozes através de IA gerativa é um tópico de várias discussões tanto na prática como no mundo dos negócios. Ao iniciar um novo negócio, é importante ter em conta os pontos mencionados acima e esforçar-se para utilizar a IA gerativa de forma adequada.
Artigo relacionado: A geração de ‘voz’ por IA constitui uma violação dos direitos autorais? (#1 Fase de desenvolvimento e aprendizagem)[ja]
Apresentação das Medidas da Nossa Firma
A Monolith Law Office é uma firma de advocacia com vasta experiência em TI, especialmente na interseção entre a internet e o direito. Nos últimos anos, a inteligência artificial emergente e os direitos de propriedade intelectual relacionados com direitos autorais têm ganhado atenção crescente, e a necessidade de verificações legais tornou-se cada vez mais premente. A nossa firma oferece soluções em propriedade intelectual, conforme detalhado nos artigos abaixo.
Áreas de atuação da Monolith Law Office: Assessoria Jurídica em TI e Propriedade Intelectual para Empresas[ja]
Category: IT