AIで「声」を生成すると著作権侵害になる?(#2 生成・利用段階編)
生成AI技術の発展により、実在する歌手や声優の「声」を簡単に学習・生成することが可能になっています。ビジネスシーンでも、アプリ開発、ゲーム開発やアニメ作成の場面などで、生成AIに「声」を学習させ、新たな「声」を生成することが可能になりました。
実在する歌手や声優の「声」を生成AIに学習させ、新たな「声」を生成することは、著作権侵害等の違法行為になる可能性があります。実際のところ、こうした問題について、現状では解釈が明確に定まってません。
ここでは、生成AIにおける生成・利用段階での著作権、著作隣接権、パブリシティ権の侵害の可能性について解説します。開発・学習段階での法的問題点はこちらの記事(#1 開発・学習段階編)で解説しております。ぜひ併せてご参照ください。
この記事の目次
生成・利用段階での3つの利用パターン
単に「生成AIで声を生成する」と言っても、その工程は以下の2つに分けて考える必要があります。
- 開発・学習段階
- 生成・利用段階
そして、1はAI開発者によって、2はAI利用者によって行われます。
これらの工程を図式化すると以下の通りです。
開発・学習段階では、AI開発の学習用データとして、人の声の元データを収集・蓄積し、学習用データセットを作成します。その後、学習用データセットをAIに入力し、機械学習を行い、学習済みのモデルを作成します。これらはAI開発者によって行われることが通常です。
生成・利用段階では、機械学習を終えた生成AIに元データを入力し、AI生成物を生成・利用します。これらはAI利用者によって行われることが通常です。
生成・利用段階の利用パターンとしては以下の3パターンを想定することができます。
- パターン1:人の声をAIに入力して、当該声データとは異なるAI生成物を生成する行為
- パターン2:人の声をAIに入力して、当該声データと同一・類似のAI生成物を生成する行為
- パターン3:人の声データではないデータをAIに入力して、実在する人物の声データと同一・類似のAI生成物を生成する行為
以下、それぞれの利用パターンがどのような権利侵害を引き起こす可能性があるか、簡単に解説していきます。
パターン1:人の声をAIに入力、当該声データとは異なる生成物を生成
まず、AIに人の声を入力し、当該声データとは異なる生成物を生成するケースにおいて起こりうる権利侵害について解説します。
著作権との関係
パターン1は、具体的には、特定の歌手の歌声データを入力するとどの歌手の声か判別する音声識別AIや、特定の歌手の声とAI利用者の声を同時に入力し、AI利用者の声で当該歌手のような歌声データを生成する行為をイメージしてください。
著作権との関係では、既存著作物をAIに入力する行為が問題となります。当該行為は、「情報解析」(著作権法(法名以下略)第30条の4第2号)に該当するため、それらの情報解析に必要と認められる限度においては、どのような方法であっても著作物を利用することができます。そのため、情報解析に必要である場合には、必要と認められる限度内であれば、著作権侵害とはなりません。
著作隣接権との関係
著作隣接権との関係でも、第102条により著作権についての規定である第30条の4が準用されていますので、上記入力行為を行っても原則著作隣接権侵害となりません。
パブリシティ権との関係
パターン1の場合に、仮に入力前の人の声が、特定の著名人であることを想定しましょう。特定の著名人の声データを利用する場合、前編(#1 開発・学習段階編)で解説した侵害態様3類型にあたる場合には、パブリシティ権侵害として、当該行為は不法行為を構成します。
今回、仮に入力された声データが特定の著名人であったとしても、当該声データは生成AIに入力して解析するに留まるため侵害態様3類型にはあたりません。
したがって、当該利用行為はパブリシティ権侵害となる余地はないと言えます。
パターン2:人の声をAIに入力して、同一・類似データを生成
パターン2とは、特定の歌手の歌声データと歌詞・メロディーデータを入力し、当該歌手の声での当該歌詞・メロディーの歌声データを生成するパターンです。大きく分けて、以下の3つに分かれます。
- 声データをAIに入力する行為
- それらを元にAI生成物を生成する行為
- 当該AI生成物を利用する行為
これらを前提に、以下の権利との関係を分析していきます。
著作権との関係
まず、著作権との関係では、1入力、2生成、3利用の全てが著作権侵害のおそれのある行為にあたります。
まず、1の入力についてです。パターン1と同様、原則として入力行為は第30条の4により著作権侵害には該当しません。
ですが、この原則には重大な例外があります。それは、元データが有する表現上の本質的特徴を有するAI生成物を生成する目的(表現出力目的)がある場合には、第30条の4は適用されず、違法となることです。そして、パターン2の場合、表現出力目的が肯定されることがほとんどです。したがって、著作権侵害となる可能性が高いと言えるでしょう。
次に2の生成についてです。パターン2の場合は、既存著作物である声データと類似・同一のデータが生成されていますので、複製権侵害(第21条)となります。したがって、著作権侵害となる可能性が高いです。
最後に3の利用についてです。2で生成された既存著作物と類似・同一の物を利用する行為は、複製権侵害(第21条)や公衆送信権侵害(第23条)となります。したがって、著作権侵害となる可能性が高いです。
著作隣接権との関係
著作隣接権との関係では実務的にまだ未確定の複雑な論点を含むため、検討が必要です。
現状では、上記同様、第102条により著作権についての規定である第30条の4が準用されていますので、原則著作隣接権侵害となる可能性は低いでしょう。
パブリシティ権との関係
1から3の行為の中で、1の入力と2の生成については、侵害態様3類型にはあたらず、パブリシティ権侵害となる余地はほとんどないと言えます。
しかし、3の利用については、当該利用方法が、販売等の商用利用である場合には、侵害態様3類型に該当するため、パブリシティ権侵害となる可能性が高いです。
パターン3:人の声データではないデータをAIに入力、実在する人物の声データと同一・類似データを生成
著作権との関係
パターン3は、例えば特定の声優名を入力して、当該声優のセリフ音声データを生成する行為です。AI生成物が既存著作物と依拠性を有しているかが問題となります。
結論としては、AI利用者が既存著作物を認識しつつ、当該著作物と同一・類似のAI生成物を生成する意図の下にAIを利用している場合には、依拠性があるとする見解が主流です。
例えば、AI利用者がある特定の声優の声を制限する目的で、AI生成物を生成した場合などがこれにあたります。したがって、上記のような場合には著作権侵害となる可能性が高いです。
著作隣接権との関係
AIを利用して既存の実演と同一・類似の実演を生成したとしても、当該行為は既存の実演の「録音」とは言えないため、著作隣接権侵害とはなりません。
パブリシティ権との関係
パブリシティ権との関係では、当該生成された声を商用利用する場合に問題が生じます。実務的には細かい場合分けが考えられるのですが、結論だけを押さえておけば足りるでしょう。
結論としては、AI利用者が、特定の著名人の声と同一・類似の声を生成する意図の下、実現し、当該同一・類似声を生成した上で、利用する場合には、パブリシティ権侵害となります。意図せず実現してしまった場合については、複雑であること、かつ実務的にまだ議論の余地が多く含まれているため、本稿では省略します。
まとめ:生成AIと著作権の関係については専門家に相談を
ここまで、人の声の有する法的権利、そしてそれらを利用する場合に問題となる行為について具体的事例を踏まえて解説してきました。
人の声の法的権利については、「内容」と「音」に分けて考えるべき点や、著作権、著作隣接権、パブリシティ権を観念し得ることが重要です。
問題となる行為について、それぞれの何が問題となっているかに目を向ける必要があります。生成AIにより声を生成する行為については、実務上もビジネス上も様々な議論がなされているところです。新しいビジネスを始める際には、上記のポイントを押さえて、適正な生成AIの利用をするように心がけましょう。
関連記事:AIで「声」を生成すると著作権侵害になる?(#1 開発・学習段階編)
当事務所による対策のご案内
モノリス法律事務所は、IT、特にインターネットと法律の両面に豊富な経験を有する法律事務所です。近年、生成AIや著作権をめぐる知的財産権は注目を集めており、リーガルチェックの必要性はますます増加しています。当事務所では知的財産に関するソリューション提供を行っております。下記記事にて詳細を記載しております。
モノリス法律事務所の取扱分野:各種企業のIT・知財法務