在AI开发中如何保护知识产权?整理版权和专利权的论点
AI(人工智能)的进步近年来显著,特别是iPhone的Siri和自动驾驶技术等深度学习技术的创新,为我们的生活带来了巨大的便利。此外,出现了许多预训练模型,如GPT-3和BERT等,AI在自然语言处理和图像生成等领域的发展显著,利用这些进行AI开发的公司也在急剧增加。
然而,要通过AI提供便利的服务,其开发过程需要大量的努力和知识积累,如何通过法律保护这些成果成为了一个问题。
本文将重点解释在提供利用AI的服务时,需要了解的法律问题,特别是关于版权和专利权的重要问题。
AI业务与知识产权法有何关联
AI业务在其运作机制上,集中了编写AI程序的努力和专业知识。因此,不仅成果物,如何保护创作过程作为知识产权也变得重要。
AI的运作机制
AI,也被称为“人工智能”,是在计算机上人工再现人类智能的东西。
让AI学习的机制如下:
- 收集和处理“学习用数据”
- 输入到学习程序进行自动学习
- 开发反映了重复学习结果的训练过的模型
- AI产生成果物
这样,AI从数据中学习的过程被称为“机器学习”,其中一种具体方法就是深度学习。在深度学习中,通过使用模仿人脑的机制(神经网络)的多层结构,可以从复杂的数据中提取特征,实现了以前无法达到的性能。
AI业务与知识产权法
在AI业务中,不仅成果物,创作过程中也会积累专业知识和成本,因此在所有过程中如何接受知识产权法的保护变得重要。知识产权是指由人类创作产生的作品、发明等,总称规定这些的法律为知识产权法。
特别是在AI业务中,关注的焦点是能够接受版权法和专利法保护的程度。
在AI的开发中,不仅完成的训练过的模型和它产生的成果物,以下的过程也有商品价值,对它们的法律保护的期待正在增加:
- 收集和处理学习用数据
- 学习用程序
- 创建的训练过的模型
- 训练过的模型产生的成果物
接下来,我们将解释这四个阶段相关的法律问题。
AI业务中学习数据的保护
学习数据是在AI进行机器学习之前的阶段,收集大量的原始数据,如图像和视频等,并将其加工为学习用途的数据。
正如人们常说的”Garbage in, garbage out(输入的是垃圾,输出的也是垃圾)”,学习数据的质量直接影响到成果的质量,因此,学习数据的法律保护问题就显得尤为重要。
相关文章:什么是网络爬虫?解析这种受到关注的便捷数据收集方法的法律问题[ja]
版权法的保护
如果学习数据本身具有”创造性”,则可以作为”数据库作品”受到版权法的保护(日本版权法第12条之2第1款[ja])。在版权法中,”数据库”被定义为”论文、数字、图形等信息的集合,这些信息可以通过计算机进行检索,并且被系统化地构造”。
在此基础上,数据的选择以及数据的排列或系统化构造必须具有创造性。例如,仅仅按照五十音顺序排列客户的地址、姓名、电话号码等信息的数据不会被认定为”数据库作品”,但如果信息的选择方法具有创造性,那么可能会被认定为具有版权。
专利法的保护
如果”学习数据”具有结构的新颖性和进步性,那么它可能会被视为”类似于程序的物品”,并可能成为”物的发明”,从而成为专利法保护的对象(日本专利法第2条第3款第1号[ja])。
在专利法中,发明被定义为”利用自然法则的技术思想创新中的高级部分”,并被分为以下三种类型:
1 “物(包括程序)”的发明
2 “方法”的发明
3 制造”物”的”方法”的发明
然而,一般认为,作为信息集合的学习数据满足”物的发明”的要求的可能性较小。
AI业务中学习程序的保护
学习程序是从输入的学习数据中发现一定的规律,并让计算机执行的程序。由于需要将神经网络的结构等输入为程序,因此在著作权法和专利法上都可能成为保护对象。
著作权法的保护
如果学习程序具有一定的复杂性,那么它将作为“程序的著作物”受到著作权的保护。
在日本文化厅,”著作物”被定义为以下几点:
- 表达思想或情感
- 创造性地表达
- 属于文学、学术、美术或音乐的范畴
为了使学习程序成为著作物,需要创造性地表达作者的个性和情感,并需要一定的复杂结构。
专利法的保护
为了使学习程序在专利法上受到保护,需要具有“进步性”。与著作权法不同,要获得专利法的保护,需要向专利局申请,并由专利局判断其“进步性”。
例如,如果使用已公开的程序A开发程序B,为了使B在专利法上受到保护,仅仅改变程序A的手段和方法的组合是不够的,需要具有不能轻易开发出来的“进步性”(日本专利法第29条第2款[ja])。
保护AI业务中的预训练模型
预训练模型是指基于训练数据让AI学习后生成的程序。例如,ChatGPT中使用的GPT(Generative Pretrained Transformer)是一个使用大量文本数据预先训练的自然语言生成模型,可以称之为预训练模型。
预训练模型也是AI业务中重要的知识产权,因此需要法律保护。
著作权法的保护
如果预训练模型符合“程序著作物”的定义,那么它将受到著作权法的保护。为此,需要工程师的个性和表达上的独创性。
举例来说,小说可以成为著作物,而构成小说的日语单词和语法则不受著作权法的保护。仅仅列出编程语言的预训练模型不会成为保护对象。
专利法的保护
预训练模型基本上不会被授予专利权。因为单纯的数据和函数本身并不符合创作的定义。
受到专利法保护的对象必须具有进步性和新颖性,并且必须符合“物(程序等)的发明”的创作物定义。
保护由学习模型产生的成果
由学习模型产生的成果,如果创作者有创作意图和为创作作品所做的创作性贡献,那么这些成果可以被认定为著作物。同样地,根据创作性贡献的程度,也可能会被授予专利权。
在这种情况下,学习模型只是创作作品的工具。因此,拥有成果的著作权和专利权的是各个用户,而不是开发系统的人。
相反,如果用户没有创作性贡献,AI自行学习并自行创作的作品被视为“AI创作物”,并不构成著作物。这是因为在著作权法上,没有思想和情感的AI不能被授予成果的著作权。
同样的原因,被授予“发明者”专利权的,也不能授予AI。
相关文章:网络上的图片爬取是否侵犯著作权法?解析机器学习的法律问题[ja]
AI创作物保护的问题点
从人类创作的物品和AI创作物在外观上越来越难以区分的现状来看,从AI创作物保护的角度来看,存在以下一些问题。
给予AI创作物同等权利的问题
假设我们给予AI创作物版权和版权保护,由于AI的高生产力,可能会导致拥有权利的创作物数量爆炸性增长。
结果可能会导致能够利用人工智能的开发者和制造商独占信息,个人创作者可能会被排挤出去。
不给予任何权利的问题
相反,如果我们不给予AI创作物任何权利,即使投入了努力和成本开发AI,也可能会出现被第三方自由使用的“搭便车”现象频繁发生,从而剥夺了对AI研究的动力。
结果可能会导致人们为了获得版权和专利权,尽量减少AI对创作物的参与,投入更多人力进行开发,从而可能会阻碍AI技术的开发和使用。
总结:关于AI的知识产权,请咨询律师
在AI开发阶段,需要从以下两个方面考虑知识产权的保护。
- 保护生成成果的AI程序
- 保护AI程序生成的成果
在各个过程中,要获得著作权,需要作品的创造性和复杂性,而要获得专利权,需要新颖性和进步性。然而,在现阶段,AI自主学习并创建的”AI创作物”并不在知识产权保护的范围内。
然而,目前还没有明确的法律规定和规则制定,政府也表示将根据AI的未来发展来制定规则。
如果您正在考虑开始AI业务,我们建议您了解当前情况,关注未来的动向,并向具有知识产权和AI业务专业知识的律师咨询。
我們事務所的對策介紹
Monolith法律事務所是一家在IT,特別是互聯網和法律兩方面都有豐富經驗的法律事務所。
AI業務伴隨著許多法律風險,需要熟悉AI相關法律問題的律師的支持。我們事務所的團隊由熟悉AI的律師和工程師等組成,為包括ChatGPT在內的AI業務提供高級法律支持,包括合同草擬,業務模型的合法性審查,知識產權保護,隱私權保護等。詳細內容已在下面的文章中說明。
Monolith法律事務所的業務範疇:AI(包括ChatGPT等)法務[ja]
Category: IT
Tag: AI (ChatGPT, etc.)IT