在AI开发中如何保护知识产权?整理版权和专利权的论点

2024.05.02

2024.05.19

AI（人工智能）的进步近年来显著，特别是iPhone的Siri和自动驾驶技术等深度学习技术的创新，为我们的生活带来了巨大的便利。此外，出现了许多预训练模型，如GPT-3和BERT等，AI在自然语言处理和图像生成等领域的发展显著，利用这些进行AI开发的公司也在急剧增加。

然而，要通过AI提供便利的服务，其开发过程需要大量的努力和知识积累，如何通过法律保护这些成果成为了一个问题。

本文将重点解释在提供利用AI的服务时，需要了解的法律问题，特别是关于版权和专利权的重要问题。

AI业务与知识产权法有何关联

AI业务在其运作机制上，集中了编写AI程序的努力和专业知识。因此，不仅成果物，如何保护创作过程作为知识产权也变得重要。

AI的运作机制

AI，也被称为“人工智能”，是在计算机上人工再现人类智能的东西。

让AI学习的机制如下：

收集和处理“学习用数据”
输入到学习程序进行自动学习
开发反映了重复学习结果的训练过的模型
AI产生成果物

这样，AI从数据中学习的过程被称为“机器学习”，其中一种具体方法就是深度学习。在深度学习中，通过使用模仿人脑的机制（神经网络）的多层结构，可以从复杂的数据中提取特征，实现了以前无法达到的性能。

AI业务与知识产权法

在AI业务中，不仅成果物，创作过程中也会积累专业知识和成本，因此在所有过程中如何接受知识产权法的保护变得重要。知识产权是指由人类创作产生的作品、发明等，总称规定这些的法律为知识产权法。

特别是在AI业务中，关注的焦点是能够接受版权法和专利法保护的程度。

在AI的开发中，不仅完成的训练过的模型和它产生的成果物，以下的过程也有商品价值，对它们的法律保护的期待正在增加：

收集和处理学习用数据
学习用程序
创建的训练过的模型
训练过的模型产生的成果物

接下来，我们将解释这四个阶段相关的法律问题。

AI业务中学习数据的保护

学习数据是在AI进行机器学习之前的阶段，收集大量的原始数据，如图像和视频等，并将其加工为学习用途的数据。

正如人们常说的”Garbage in, garbage out（输入的是垃圾，输出的也是垃圾）”，学习数据的质量直接影响到成果的质量，因此，学习数据的法律保护问题就显得尤为重要。

相关文章：什么是网络爬虫？解析这种受到关注的便捷数据收集方法的法律问题[ja]

版权法的保护

如果学习数据本身具有”创造性”，则可以作为”数据库作品”受到版权法的保护（日本版权法第12条之2第1款[ja]）。在版权法中，”数据库”被定义为”论文、数字、图形等信息的集合，这些信息可以通过计算机进行检索，并且被系统化地构造”。

在此基础上，数据的选择以及数据的排列或系统化构造必须具有创造性。例如，仅仅按照五十音顺序排列客户的地址、姓名、电话号码等信息的数据不会被认定为”数据库作品”，但如果信息的选择方法具有创造性，那么可能会被认定为具有版权。

专利法的保护

如果”学习数据”具有结构的新颖性和进步性，那么它可能会被视为”类似于程序的物品”，并可能成为”物的发明”，从而成为专利法保护的对象（日本专利法第2条第3款第1号[ja]）。

在专利法中，发明被定义为”利用自然法则的技术思想创新中的高级部分”，并被分为以下三种类型：

1 “物（包括程序）”的发明
2 “方法”的发明
3 制造”物”的”方法”的发明

然而，一般认为，作为信息集合的学习数据满足”物的发明”的要求的可能性较小。

AI业务中学习程序的保护

学习程序是从输入的学习数据中发现一定的规律，并让计算机执行的程序。由于需要将神经网络的结构等输入为程序，因此在著作权法和专利法上都可能成为保护对象。

著作权法的保护

如果学习程序具有一定的复杂性，那么它将作为“程序的著作物”受到著作权的保护。

在日本文化厅，”著作物”被定义为以下几点：

表达思想或情感
创造性地表达
属于文学、学术、美术或音乐的范畴

为了使学习程序成为著作物，需要创造性地表达作者的个性和情感，并需要一定的复杂结构。

专利法的保护

为了使学习程序在专利法上受到保护，需要具有“进步性”。与著作权法不同，要获得专利法的保护，需要向专利局申请，并由专利局判断其“进步性”。

例如，如果使用已公开的程序A开发程序B，为了使B在专利法上受到保护，仅仅改变程序A的手段和方法的组合是不够的，需要具有不能轻易开发出来的“进步性”（日本专利法第29条第2款[ja]）。

保护AI业务中的预训练模型

预训练模型是指基于训练数据让AI学习后生成的程序。例如，ChatGPT中使用的GPT（Generative Pretrained Transformer）是一个使用大量文本数据预先训练的自然语言生成模型，可以称之为预训练模型。

预训练模型也是AI业务中重要的知识产权，因此需要法律保护。

著作权法的保护

如果预训练模型符合“程序著作物”的定义，那么它将受到著作权法的保护。为此，需要工程师的个性和表达上的独创性。

举例来说，小说可以成为著作物，而构成小说的日语单词和语法则不受著作权法的保护。仅仅列出编程语言的预训练模型不会成为保护对象。

专利法的保护

预训练模型基本上不会被授予专利权。因为单纯的数据和函数本身并不符合创作的定义。

受到专利法保护的对象必须具有进步性和新颖性，并且必须符合“物（程序等）的发明”的创作物定义。

保护由学习模型产生的成果

由学习模型产生的成果，如果创作者有创作意图和为创作作品所做的创作性贡献，那么这些成果可以被认定为著作物。同样地，根据创作性贡献的程度，也可能会被授予专利权。

在这种情况下，学习模型只是创作作品的工具。因此，拥有成果的著作权和专利权的是各个用户，而不是开发系统的人。

相反，如果用户没有创作性贡献，AI自行学习并自行创作的作品被视为“AI创作物”，并不构成著作物。这是因为在著作权法上，没有思想和情感的AI不能被授予成果的著作权。

同样的原因，被授予“发明者”专利权的，也不能授予AI。

相关文章：网络上的图片爬取是否侵犯著作权法？解析机器学习的法律问题[ja]

AI创作物保护的问题点

从人类创作的物品和AI创作物在外观上越来越难以区分的现状来看，从AI创作物保护的角度来看，存在以下一些问题。

给予AI创作物同等权利的问题

假设我们给予AI创作物版权和版权保护，由于AI的高生产力，可能会导致拥有权利的创作物数量爆炸性增长。

结果可能会导致能够利用人工智能的开发者和制造商独占信息，个人创作者可能会被排挤出去。

不给予任何权利的问题

相反，如果我们不给予AI创作物任何权利，即使投入了努力和成本开发AI，也可能会出现被第三方自由使用的“搭便车”现象频繁发生，从而剥夺了对AI研究的动力。

结果可能会导致人们为了获得版权和专利权，尽量减少AI对创作物的参与，投入更多人力进行开发，从而可能会阻碍AI技术的开发和使用。

总结：关于AI的知识产权，请咨询律师

在AI开发阶段，需要从以下两个方面考虑知识产权的保护。

保护生成成果的AI程序
保护AI程序生成的成果

在各个过程中，要获得著作权，需要作品的创造性和复杂性，而要获得专利权，需要新颖性和进步性。然而，在现阶段，AI自主学习并创建的”AI创作物”并不在知识产权保护的范围内。

然而，目前还没有明确的法律规定和规则制定，政府也表示将根据AI的未来发展来制定规则。

如果您正在考虑开始AI业务，我们建议您了解当前情况，关注未来的动向，并向具有知识产权和AI业务专业知识的律师咨询。

我們事務所的對策介紹

Monolith法律事務所是一家在IT，特別是互聯網和法律兩方面都有豐富經驗的法律事務所。

AI業務伴隨著許多法律風險，需要熟悉AI相關法律問題的律師的支持。我們事務所的團隊由熟悉AI的律師和工程師等組成，為包括ChatGPT在內的AI業務提供高級法律支持，包括合同草擬，業務模型的合法性審查，知識產權保護，隱私權保護等。詳細內容已在下面的文章中說明。

Monolith法律事務所的業務範疇：AI（包括ChatGPT等）法務[ja]

The Editor in Chief: Managing Attorney: Toki Kawase

An expert in IT-related legal affairs in Japan who established MONOLITH LAW OFFICE and serves as its managing attorney. Formerly an IT engineer, he has been involved in the management of IT companies. Served as legal counsel to more than 100 companies, ranging from top-tier organizations to seed-stage Startups.

Category: IT

Tag: AI (ChatGPT, etc.)IT

在AI开发中如何保护知识产权?整理版权和专利权的论点