¿Generar "voces" con IA podría constituir una infracción de derechos de autor? (#2 Edición de generación y uso)

Con el desarrollo de la tecnología de inteligencia artificial generativa, se ha hecho posible aprender y generar fácilmente la “voz” de cantantes y actores de voz reales. En el ámbito empresarial, el desarrollo de aplicaciones, juegos y la creación de animaciones, entre otros, ahora permite enseñar a la IA generativa estas “voces” y generar nuevas “voces”.
Hacer que la IA generativa aprenda y genere la “voz” de cantantes y actores de voz reales puede constituir una infracción de derechos de autor u otras actividades ilegales. De hecho, la interpretación de estos problemas no está claramente definida en la actualidad.
Aquí explicaremos la posibilidad de infringir los derechos de autor, los derechos conexos y los derechos de publicidad en las etapas de generación y uso de la IA generativa. Los problemas legales en la etapa de desarrollo y aprendizaje se explican en este artículo (Edición #1 sobre la etapa de desarrollo y aprendizaje)[ja]. Por favor, consulte también este recurso.
Tres patrones de uso en la fase de generación y utilización
Decir simplemente “generar una voz con IA” no es suficiente; es necesario considerar el proceso en las siguientes dos etapas:
- Etapa de desarrollo y aprendizaje
- Etapa de generación y utilización
La etapa 1 es llevada a cabo por los desarrolladores de IA, mientras que la etapa 2 es realizada por los usuarios de IA.
Si visualizamos estos procesos, el esquema sería el siguiente:

En la etapa de desarrollo y aprendizaje, se recopilan y almacenan datos originales de voces humanas como datos de aprendizaje para el desarrollo de IA, creando conjuntos de datos de aprendizaje. Luego, estos conjuntos de datos se introducen en la IA para realizar el aprendizaje automático y crear un modelo ya entrenado. Estas tareas son normalmente realizadas por los desarrolladores de IA.
En la etapa de generación y utilización, se introducen datos originales en la IA de generación que ha completado el aprendizaje automático para generar y utilizar productos de IA. Estas tareas son normalmente realizadas por los usuarios de IA.
Como patrones de uso en la etapa de generación y utilización, podemos considerar los siguientes tres:
- Patrón 1: Introducir una voz humana en la IA para generar un producto de IA diferente al dato de voz original.
- Patrón 2: Introducir una voz humana en la IA para generar un producto de IA idéntico o similar al dato de voz original.
- Patrón 3: Introducir datos que no son de voz humana en la IA para generar un producto de IA idéntico o similar a los datos de voz de una persona real.
A continuación, explicaremos brevemente qué tipo de infracciones de derechos podrían surgir de cada uno de estos patrones de uso.
Patrón 1: Introducir la voz humana en la IA para generar productos diferentes a los datos de voz originales

Primero, explicaremos las posibles infracciones de derechos que pueden ocurrir al introducir la voz humana en una IA y generar productos diferentes a los datos de voz originales.
Relación con los derechos de autor
El Patrón 1 implica, específicamente, acciones como introducir en una IA los datos de la voz de un cantante específico para que un sistema de reconocimiento de voz identifique a qué cantante pertenece o, introducir simultáneamente la voz de un cantante específico y la del usuario de la IA para generar datos de voz que suenen como el cantante en cuestión.
En relación con los derechos de autor, el problema surge al introducir obras existentes en la IA. Dicha acción corresponde a “análisis de información” (Artículo 30-4, inciso 2 de la Ley de Derechos de Autor de Japón), por lo que, en la medida en que se considere necesario para dicho análisis de información, se puede utilizar cualquier método para emplear las obras. Por lo tanto, si se considera necesario para el análisis de información, el uso dentro de los límites reconocidos como necesarios no constituirá una infracción de derechos de autor.
Relación con los derechos conexos
En cuanto a los derechos conexos, el Artículo 102 aplica las disposiciones de los derechos de autor del Artículo 30-4, por lo que las acciones mencionadas anteriormente no constituyen, en principio, una infracción de los derechos conexos.
Relación con el derecho de publicidad
En el caso del Patrón 1, supongamos que la voz introducida pertenece a una persona famosa específica. Si se utilizan los datos de voz de una persona famosa, y el caso se ajusta a uno de los tres tipos de infracciones explicados en la Primera parte (#1 Fase de desarrollo y aprendizaje)[ja], entonces la acción constituirá una infracción del derecho de publicidad y, por ende, un acto ilícito.
En esta ocasión, incluso si la voz introducida pertenece a una persona famosa específica, dado que los datos de voz solo se introducen en la IA para su análisis, no se ajusta a los tres tipos de infracciones mencionados.
Por lo tanto, se puede decir que no hay margen para una infracción del derecho de publicidad en el uso en cuestión.
Patrón 2: Introducir la voz humana en la IA para generar datos idénticos o similares
El Patrón 2 consiste en introducir en la IA datos de la voz de un cantante específico junto con los datos de la letra y la melodía, para generar datos de voz cantando esa letra y melodía con la voz del cantante en cuestión. Se divide principalmente en tres acciones:
- La acción de introducir datos de voz en la IA
- La acción de generar productos de IA a partir de esos datos
- La acción de utilizar dichos productos de IA
Con estas premisas, analizaremos la relación con los siguientes derechos.
Relación con los derechos de autor
En primer lugar, en cuanto a la relación con los derechos de autor, todas las acciones de 1) introducción, 2) generación y 3) uso pueden constituir actos susceptibles de infringir los derechos de autor.
Comenzando con la acción 1) de introducción. Al igual que en el Patrón 1, en principio, la acción de introducir datos no constituye una infracción de los derechos de autor según el Artículo 30-4. Sin embargo, hay una excepción importante a este principio. Si el propósito es generar un producto de IA que posea las características esenciales de la expresión del dato original (propósito de salida de expresión), entonces el Artículo 30-4 no se aplica y la acción se vuelve ilegal. En el caso del Patrón 2, el propósito de salida de expresión se afirma en la mayoría de los casos. Por lo tanto, es muy probable que constituya una infracción de los derechos de autor.
A continuación, sobre la acción 2) de generación. En el caso del Patrón 2, se generan datos idénticos o similares a una obra de autor existente, lo que constituye una infracción del derecho de reproducción (Artículo 21). Por lo tanto, es muy probable que constituya una infracción de los derechos de autor.
Finalmente, sobre la acción 3) de uso. El uso de objetos idénticos o similares a una obra de autor existente generados en 2) constituye una infracción del derecho de reproducción (Artículo 21) o del derecho de transmisión al público (Artículo 23). Por lo tanto, es muy probable que constituya una infracción de los derechos de autor.
Relación con los derechos conexos
En relación con los derechos conexos, como aún hay puntos complejos y no confirmados en la práctica, es necesario un análisis.
En la situación actual, al igual que en los casos anteriores, se aplica por analogía el Artículo 30-4, que es una disposición sobre los derechos de autor, según el Artículo 102, por lo que en principio la posibilidad de infringir los derechos conexos es baja.
Relación con el derecho de publicidad
Entre las acciones de 1) a 3), en cuanto a la introducción 1) y la generación 2), no se considera que infrinjan los tres tipos de modalidades de infracción, por lo que hay muy poco margen para que constituyan una infracción del derecho de publicidad.
Sin embargo, en cuanto al uso 3), si el método de uso implica un uso comercial, como la venta, entonces se ajusta a los tres tipos de modalidades de infracción, por lo que es muy probable que constituya una infracción del derecho de publicidad.
Patrón 3: Introducir datos no vocales en la IA para generar datos idénticos o similares a los de una voz real

Relación con los derechos de autor
El Patrón 3 consiste, por ejemplo, en introducir el nombre de un determinado actor de voz en la IA para generar datos de audio de sus diálogos. El problema surge en si los objetos generados por la IA dependen de obras protegidas por derechos de autor existentes.
La conclusión predominante es que si el usuario de la IA utiliza la tecnología conscientemente para generar objetos de IA idénticos o similares a una obra protegida por derechos de autor, se considera que existe dependencia.
Por ejemplo, si un usuario de la IA genera un objeto de IA con la intención de replicar la voz de un actor de voz específico para restringirla, este acto se consideraría dependiente. Por lo tanto, en tales casos, es muy probable que se incurra en una infracción de derechos de autor.
Relación con los derechos conexos
Aunque se utilice la IA para generar una actuación idéntica o similar a una existente, dicho acto no se considera una “grabación” de la actuación existente, por lo que no constituye una infracción de los derechos conexos.
Relación con el derecho de publicidad
En relación con el derecho de publicidad, surgen problemas cuando se utiliza comercialmente la voz generada. En la práctica, se pueden considerar varios casos específicos, pero basta con comprender la conclusión.
La conclusión es que si el usuario de la IA genera intencionadamente una voz idéntica o similar a la de una persona famosa y la utiliza, se incurre en una infracción del derecho de publicidad. Los casos en los que la voz se genera sin intención son más complejos y aún están sujetos a debate en la práctica, por lo que se omiten en este artículo.
Conclusión: Consulte a un experto sobre la relación entre la IA generativa y los derechos de autor
Hasta ahora, hemos explicado, basándonos en casos concretos, los derechos legales que posee la voz humana y las acciones que pueden ser problemáticas al utilizarlos.
Es importante considerar los derechos legales de la voz humana dividiéndolos en “contenido” y “sonido”, y tener en cuenta los derechos de autor, los derechos conexos y los derechos de publicidad.
En cuanto a las acciones problemáticas, es necesario prestar atención a qué es lo que las hace problemáticas. En la práctica, hay una variedad de debates tanto en el ámbito empresarial como en el legal sobre la generación de voces mediante IA generativa. Al iniciar un nuevo negocio, es esencial tener en cuenta los puntos mencionados anteriormente y esforzarse por utilizar la IA generativa de manera adecuada.
Artículo relacionado: ¿Generar ‘voz’ con IA podría infringir los derechos de autor? (#1 Fase de desarrollo y aprendizaje)[ja]
Presentación de Estrategias por Monolith Law Office
Monolith Law Office es un despacho de abogados con una amplia experiencia en IT, especialmente en la intersección entre Internet y el derecho. En los últimos años, la inteligencia artificial generativa y los derechos de propiedad intelectual relacionados con los derechos de autor han ganado mucha atención, y la necesidad de revisiones legales se ha incrementado significativamente. Nuestro despacho ofrece soluciones en el ámbito de la propiedad intelectual. Los detalles se encuentran en el artículo a continuación.
Áreas de práctica de Monolith Law Office: Servicios legales de IT y propiedad intelectual para diversos clientes[ja]
Category: IT