什麼是網路抓取?解釋法律問題中引人注目的便利數據收集方法
隨著數據分析和AI技術的進步,「數據收集」受到了廣泛的關注。因此,利用「網路抓取」進行數據收集的方法正受到矚目。即使公司沒有足夠的數據積累,也可以輕鬆使用網路抓取,這一點非常方便。然而,如果使用不當,可能會導致騷擾行為或違法行為。因此,使用網路抓取時,理解與網路抓取相關的法律問題非常重要。
因此,本文將針對考慮使用網路抓取的業者,解釋與網路抓取相關的法律問題。
何謂網路抓取
網路抓取(Scraping)是一個源自英語的電腦術語,意指「擦拭」或「聚集」。它指的是從特定的網站或程式中抽取、獲取、收集數據和信息的技術。
這種技術也常被稱為網路抓取、網路爬蟲、網路蜘蛛等。
近年來,由於數據和信息的價值日益提高,利用網路抓取進行數據和信息的抽取、獲取、收集的企業也在增加。
具體來說,首先,本所會利用網路抓取進行必要信息的抽取、獲取、收集。
然後,本所會對收集到的數據進行分析等操作,並根據網路抓取的目的,創建數據庫。
最後,本所會將數據庫提供給客戶,或者用於自家的業務。
網路爬蟲在法律上可能出問題的情況
並非所有的網路爬蟲行為都會引發法律問題,只有在特定的情況下才可能出現法律問題。
以下,本所將介紹可能引發法律問題的情況。
違反禁止網路爬蟲的使用條款的情況
在使用特定網站時,如果用戶已經同意該網站的使用條款,那麼用戶就需要按照使用條款進行使用。
如果使用條款中包含禁止網路爬蟲的條款,那麼當然,已經同意使用條款的人不能違反使用條款進行網路爬蟲。
如果違反使用條款進行網路爬蟲,可能會構成違約或侵權行為,並可能被網站運營者追究民事責任,如要求賠償損害或停止網路爬蟲等。
https://monolith-law.jp/corporate/web-terms-of-service-part1[ja]
https://monolith-law.jp/corporate/web-terms-of-service-part2[ja]
違反著作權法的情況
特定網站上的數據或內容可能被認定為具有著作權,如果被認定為具有著作權,則將受到著作權法的保護。
因此,進行網路爬蟲時,需要注意不要違反著作權法。
什麼是著作權
著作權是保護著作物的權利。
著作物是指以創作的方式表現思想或情感的作品,包括文學、學術、美術或音樂等範疇的作品(日本著作權法第2條第1項1號)。
網路爬蟲的數據或內容不被認定為具有著作權的情況
特定網站上的數據或內容可能被認定為具有著作權,並受到著作權法的保護。然而,如果只是單純的數據等,並未被認定為具有著作權,則不會受到著作權法的保護。
因此,在使用網路爬蟲時,需要確認收集的數據內容,並考慮是否被認定為具有著作權。
網路爬蟲的數據或內容被認定為具有著作權的情況
如果網路爬蟲的數據或內容被認定為具有著作權,則將受到著作權法的保護。
在進行網路爬蟲時,如果涉及到複製數據或內容的操作,如果未經權利人同意,可能會侵犯權利人的複製權(日本著作權法第21條)等權利。
然而,如果符合著作權法第30條的4(不以享受著作物中表現的思想或情感為目的的使用)的規定,則不構成侵犯著作權。
此外,如果符合著作權法第47條的5(電子計算機進行的信息處理及其結果的提供伴隨的輕微使用等)的規定,也不構成侵犯著作權。
導致伺服器高流量的情況
進行網路爬蟲可能導致網站流量過高,使伺服器無法運作,導致無法瀏覽或顯示網站。
在這種情況下,由於目標網站的伺服器無法運作,運營該網站的公司等可能無法進行業務,可能會被追究偽計業務妨害罪(日本刑法第233條)或電子計算機損壞等業務妨害(日本刑法第234條的2)的責任。
違反個人信息保護法的情況
網路爬蟲可能會收集個人信息。
在收集個人信息時,需要向本人明確說明使用目的。然而,對特定的人單獨明確說明使用目的可能並不現實。
因此,如果預計進行網路爬蟲並收集個人信息,則需要公開隱私政策或個人信息保護政策等,並明確說明使用目的。
另外,對於需要特別注意的個人信息(如種族、信仰、社會地位、病歷、犯罪歷史等),僅公開隱私政策或個人信息保護政策等並不能收集該信息,需要獲得本人的同意,因此需要特別注意。
此外,也可能會將網路爬蟲收集的個人信息整理成數據庫,並提供給第三方。
然而,如果提供給第三方,原則上需要事先獲得本人的同意(日本個人信息保護法第27條),因此,這一點也需要注意。
https://monolith-law.jp/corporate/checkpoint-privacy-policy[ja]
實際發生的網路爬蟲問題案例
一個實際發生的網路爬蟲問題案例是2010年3月左右發生的岡崎市立中央圖書館事件。
該事件是岡崎市立中央圖書館的藏書搜尋系統出現訪問障礙,後來發現訪問障礙的原因是網路爬蟲,並且使用網路爬蟲的男性因涉嫌偽計業務妨礙而被逮捕。
被逮捕的男性是岡崎市立中央圖書館的使用者,但他對岡崎市立中央圖書館的藏書系統的使用不便感到不滿,因此訪問了藏書系統並提取了藏書系統的數據。
被逮捕的男性被拘留了20天,但最終因為無法確認他有強烈的妨礙岡崎市立中央圖書館業務的意圖,因此被判為緩起訴處分。
雖然這次事件的處分相對輕微,但根據網路爬蟲的內容,可能會導致嚴重的處分,因此需要注意。
總結
以上,本所針對打算利用網路抓取(scraping)的企業家,對於網路抓取相關的法律問題進行了說明。
對於網路抓取,其使用方式將決定是否會引發法律問題。因此,如果不加考慮地輕易進行網路抓取,可能會引發法律問題,所以需要特別注意。
對於網路抓取是否會引發法律問題的判斷,需要專業的知識。因此,本所建議打算利用網路抓取的企業家,應該向具有專業知識的律師進行諮詢。
由本所事務所提供的對策介紹
Monolith法律事務所是一家在IT,特別是互聯網和法律兩方面具有高度專業性的法律事務所。近年來,使用網路爬蟲的注意事項引起了大眾的關注。法律審查的必要性正在日益增加。本所事務所會在考慮到各種法律規定的基礎上,分析已經開始或即將開始的業務的法律風險,並盡可能在不停止業務的情況下尋求合法化。詳細內容已在下面的文章中說明。