MONOLITH LAW OFFICE+81-3-6262-3248工作日 10:00-18:00 JST [English Only]

MONOLITH LAW MAGAZINE

General Corporate

什么是网络抓取?解析这种受到关注的便捷数据收集方法的法律问题

General Corporate

什么是网络抓取?解析这种受到关注的便捷数据收集方法的法律问题

随着数据分析和AI技术的进步,“数据收集”正在引起人们的关注。因此,“网页抓取”作为一种数据收集方法正在受到瞩目。即使公司没有足够的数据积累,也可以方便地使用网页抓取。然而,使用方式不当可能会导致骚扰行为或违法行为。因此,使用网页抓取时,理解与网页抓取相关的法律问题非常重要。

因此,本文将针对考虑使用网页抓取的企业,解释与网页抓取相关的法律问题。

什么是网络抓取

网络抓取,或者叫做“Scraping”,是一个源自英语的计算机术语,意思是“擦”或“刮”。它指的是从特定的网站或程序中提取、获取、收集数据或信息的技术。

它也被称为网页抓取、网络爬虫、网络蜘蛛等。

近年来,随着数据和信息价值的提升,利用网络抓取技术进行数据和信息的提取、获取、收集的企业也在增加。

具体来说,首先,我们通过网络抓取进行必要信息的提取、获取、收集。

然后,我们对收集的数据进行分析等操作,根据网络抓取的目标,创建数据库。

最后,我们将数据库提供给客户,或者用于自己的业务。

涉及网络爬虫的法律问题案例

并非所有的网络爬虫行为都会引发法律问题,只有在特定的情况下才可能出现法律问题。

因此,接下来我们将介绍可能引发法律问题的案例。

违反禁止网络抓取的使用条款的情况

在使用特定网站时,如果用户已经同意了该网站的使用条款,那么用户就需要按照使用条款进行操作。

如果使用条款中包含禁止网络抓取的条款,那么自然,已经同意使用条款的用户不能违反使用条款进行网络抓取。

如果违反使用条款进行网络抓取,可能会构成违约或非法行为,可能会被网站运营者追究赔偿损失或停止网络抓取等民事责任。

https://monolith-law.jp/corporate/web-terms-of-service-part1[ja]

https://monolith-law.jp/corporate/web-terms-of-service-part2[ja]

侵犯版权法的情况

特定网站上的数据和内容在某些情况下可能被认定为具有版权,如果被认定为具有版权,将受到版权法的保护。

因此,在进行网络爬取时,需要注意不要违反版权法。

什么是版权

版权是保护作品的权利。

作品是指以创造性方式表达思想或情感的东西,包括文学、学术、美术或音乐范畴的作品(日本版权法第2条第1款1号)。

进行网络爬取的数据和内容不被认定为具有版权的情况

特定网站上的数据和内容在某些情况下可能被认定为具有版权,从而受到版权法的保护,但另一方面,如果只是单纯的数据等,不被认定为具有版权,那么就不会受到版权法的保护。

因此,在使用网络爬取时,需要确认收集哪些内容的数据,并考虑是否可能被认定为具有版权。

进行网络爬取的数据和内容被认定为具有版权的情况

如果进行网络爬取的数据和内容被认定为具有版权,那么将受到版权法的保护。

在进行网络爬取时,如果涉及到复制数据或内容的操作,如果未经权利人同意就进行,可能会侵犯权利人的复制权(日本版权法第21条)等权利。

相关文章:抓取互联网上的图片是否违反版权法?解释机器学习的法律问题[ja]

然而,如果符合版权法修正后新增的日本版权法第30条第4款(不以享受作品中表达的思想或情感为目的的使用),则不构成侵犯版权。

另外,如果符合日本版权法第47条第5款(电子计算机进行的信息处理及其结果的提供伴随的轻微使用等),也不构成侵犯版权。

服务器高访问量的情况

通过进行网络抓取,可能会导致网站访问量过高,服务器崩溃,无法浏览或显示网站。

在这种情况下,由于目标网站的服务器崩溃,运营该网站的公司等可能无法进行业务,因此可能会被追究日本《刑法第233条》中的欺诈业务妨碍罪或《刑法第234条之2》中的电子计算机损坏等业务妨碍罪的责任。

违反个人信息保护法的案例

我们可以考虑到通过网络爬虫获取个人信息的情况。

在获取个人信息时,必须向本人明确使用目的。然而,我们认为对特定的人明确个别的使用目的在现实中是不可能的。

因此,如果预计会通过网络爬虫获取个人信息,就需要公开隐私政策和个人信息保护政策等,明确使用目的。

另外,对于需要特别注意的个人信息(如本人的种族、信仰、社会地位、病史、犯罪记录等),仅公开隐私政策和个人信息保护政策等是不足以获取的,必须得到本人的同意,因此需要注意。

此外,我们也预计到将通过网络爬虫获取的个人信息数据库化,并提供给第三方的情况。

但是,如果要向第三方提供,原则上需要事先获得本人的同意(日本个人信息保护法第27条),因此这一点也需要注意。

https://monolith-law.jp/corporate/checkpoint-privacy-policy[ja]

实际出现的网络抓取问题案例

作为实际出现的网络抓取问题案例,有2010年3月左右发生的日本岡崎市立中央图书馆事件。

这是一个发生在岡崎市立中央图书馆的藏书搜索系统出现访问障碍,后来发现访问障碍的原因是网络抓取,进行网络抓取的男性因涉嫌虚假业务妨碍而被逮捕的事件。

被逮捕的男性是岡崎市立中央图书馆的用户,但他对岡崎市立中央图书馆的藏书系统的使用感到不满,因此访问了藏书系统,并进行了提取藏书系统数据的行为。

被逮捕的男性被拘留了20天,但最终,由于没有证据证明他有强烈的意图妨碍岡崎市立中央图书馆的业务,因此被判处起诉猶予处理。

虽然这个事件最后被判处相对较轻的起诉猶予处理,但根据网络抓取的内容,可能会受到严重的处罚,因此需要注意。

总结

以上,我们针对打算使用网络抓取技术的企业家,对网络抓取相关的法律问题进行了说明。

关于网络抓取,根据使用方式的不同,可能会引发法律问题。因此,如果不经过深思熟虑,轻易地进行网络抓取,可能会引发法律问题,所以需要谨慎。

对于网络抓取是否会引发法律问题的判断,需要专业知识。因此,我们建议打算使用网络抓取的企业家,向具有专业知识的律师进行咨询。

我們事務所的對策介紹

Monolith法律事務所是一家在IT,特別是互聯網和法律兩方面都具有高度專業性的法律事務所。近年來,使用網路爬蟲的注意事項引起了人們的關注。法律審查的必要性正在日益增加。我們事務所將在考慮到各種法律規定的基礎上,分析已經開始或即將開始的業務的法律風險,並盡可能在不停止業務的情況下尋求合法化。詳細內容已在下面的文章中說明。

https://monolith.law/systemdevelopment[ja]

Managing Attorney: Toki Kawase

The Editor in Chief: Managing Attorney: Toki Kawase

An expert in IT-related legal affairs in Japan who established MONOLITH LAW OFFICE and serves as its managing attorney. Formerly an IT engineer, he has been involved in the management of IT companies. Served as legal counsel to more than 100 companies, ranging from top-tier organizations to seed-stage Startups.

Return to Top