什么是网络抓取?解析这种受到关注的便捷数据收集方法的法律问题
随着数据分析和AI技术的进步,“数据收集”正在引起人们的关注。因此,“网页抓取”作为一种数据收集方法正在受到瞩目。即使公司没有足够的数据积累,也可以方便地使用网页抓取。然而,使用方式不当可能会导致骚扰行为或违法行为。因此,使用网页抓取时,理解与网页抓取相关的法律问题非常重要。
因此,本文将针对考虑使用网页抓取的企业,解释与网页抓取相关的法律问题。
什么是网络抓取
网络抓取,或者叫做“Scraping”,是一个源自英语的计算机术语,意思是“擦”或“刮”。它指的是从特定的网站或程序中提取、获取、收集数据或信息的技术。
它也被称为网页抓取、网络爬虫、网络蜘蛛等。
近年来,随着数据和信息价值的提升,利用网络抓取技术进行数据和信息的提取、获取、收集的企业也在增加。
具体来说,首先,我们通过网络抓取进行必要信息的提取、获取、收集。
然后,我们对收集的数据进行分析等操作,根据网络抓取的目标,创建数据库。
最后,我们将数据库提供给客户,或者用于自己的业务。
涉及网络爬虫的法律问题案例
并非所有的网络爬虫行为都会引发法律问题,只有在特定的情况下才可能出现法律问题。
因此,接下来我们将介绍可能引发法律问题的案例。
违反禁止网络抓取的使用条款的情况
在使用特定网站时,如果用户已经同意了该网站的使用条款,那么用户就需要按照使用条款进行操作。
如果使用条款中包含禁止网络抓取的条款,那么自然,已经同意使用条款的用户不能违反使用条款进行网络抓取。
如果违反使用条款进行网络抓取,可能会构成违约或非法行为,可能会被网站运营者追究赔偿损失或停止网络抓取等民事责任。
https://monolith-law.jp/corporate/web-terms-of-service-part1[ja]
https://monolith-law.jp/corporate/web-terms-of-service-part2[ja]
侵犯版权法的情况
特定网站上的数据和内容在某些情况下可能被认定为具有版权,如果被认定为具有版权,将受到版权法的保护。
因此,在进行网络爬取时,需要注意不要违反版权法。
什么是版权
版权是保护作品的权利。
作品是指以创造性方式表达思想或情感的东西,包括文学、学术、美术或音乐范畴的作品(日本版权法第2条第1款1号)。
进行网络爬取的数据和内容不被认定为具有版权的情况
特定网站上的数据和内容在某些情况下可能被认定为具有版权,从而受到版权法的保护,但另一方面,如果只是单纯的数据等,不被认定为具有版权,那么就不会受到版权法的保护。
因此,在使用网络爬取时,需要确认收集哪些内容的数据,并考虑是否可能被认定为具有版权。
进行网络爬取的数据和内容被认定为具有版权的情况
如果进行网络爬取的数据和内容被认定为具有版权,那么将受到版权法的保护。
在进行网络爬取时,如果涉及到复制数据或内容的操作,如果未经权利人同意就进行,可能会侵犯权利人的复制权(日本版权法第21条)等权利。
相关文章:抓取互联网上的图片是否违反版权法?解释机器学习的法律问题[ja]
然而,如果符合版权法修正后新增的日本版权法第30条第4款(不以享受作品中表达的思想或情感为目的的使用),则不构成侵犯版权。
另外,如果符合日本版权法第47条第5款(电子计算机进行的信息处理及其结果的提供伴随的轻微使用等),也不构成侵犯版权。
服务器高访问量的情况
通过进行网络抓取,可能会导致网站访问量过高,服务器崩溃,无法浏览或显示网站。
在这种情况下,由于目标网站的服务器崩溃,运营该网站的公司等可能无法进行业务,因此可能会被追究日本《刑法第233条》中的欺诈业务妨碍罪或《刑法第234条之2》中的电子计算机损坏等业务妨碍罪的责任。
违反个人信息保护法的案例
我们可以考虑到通过网络爬虫获取个人信息的情况。
在获取个人信息时,必须向本人明确使用目的。然而,我们认为对特定的人明确个别的使用目的在现实中是不可能的。
因此,如果预计会通过网络爬虫获取个人信息,就需要公开隐私政策和个人信息保护政策等,明确使用目的。
另外,对于需要特别注意的个人信息(如本人的种族、信仰、社会地位、病史、犯罪记录等),仅公开隐私政策和个人信息保护政策等是不足以获取的,必须得到本人的同意,因此需要注意。
此外,我们也预计到将通过网络爬虫获取的个人信息数据库化,并提供给第三方的情况。
但是,如果要向第三方提供,原则上需要事先获得本人的同意(日本个人信息保护法第27条),因此这一点也需要注意。
https://monolith-law.jp/corporate/checkpoint-privacy-policy[ja]
实际出现的网络抓取问题案例
作为实际出现的网络抓取问题案例,有2010年3月左右发生的日本岡崎市立中央图书馆事件。
这是一个发生在岡崎市立中央图书馆的藏书搜索系统出现访问障碍,后来发现访问障碍的原因是网络抓取,进行网络抓取的男性因涉嫌虚假业务妨碍而被逮捕的事件。
被逮捕的男性是岡崎市立中央图书馆的用户,但他对岡崎市立中央图书馆的藏书系统的使用感到不满,因此访问了藏书系统,并进行了提取藏书系统数据的行为。
被逮捕的男性被拘留了20天,但最终,由于没有证据证明他有强烈的意图妨碍岡崎市立中央图书馆的业务,因此被判处起诉猶予处理。
虽然这个事件最后被判处相对较轻的起诉猶予处理,但根据网络抓取的内容,可能会受到严重的处罚,因此需要注意。
总结
以上,我们针对打算使用网络抓取技术的企业家,对网络抓取相关的法律问题进行了说明。
关于网络抓取,根据使用方式的不同,可能会引发法律问题。因此,如果不经过深思熟虑,轻易地进行网络抓取,可能会引发法律问题,所以需要谨慎。
对于网络抓取是否会引发法律问题的判断,需要专业知识。因此,我们建议打算使用网络抓取的企业家,向具有专业知识的律师进行咨询。
我們事務所的對策介紹
Monolith法律事務所是一家在IT,特別是互聯網和法律兩方面都具有高度專業性的法律事務所。近年來,使用網路爬蟲的注意事項引起了人們的關注。法律審查的必要性正在日益增加。我們事務所將在考慮到各種法律規定的基礎上,分析已經開始或即將開始的業務的法律風險,並盡可能在不停止業務的情況下尋求合法化。詳細內容已在下面的文章中說明。