Scraping là gì? Giải thích vấn đề pháp lý của phương pháp thu thập dữ liệu tiện ích đang thu hút sự chú ý
Khi tiến bộ trong phân tích dữ liệu và công nghệ AI, “việc thu thập dữ liệu” đang thu hút sự chú ý. Do đó, phương pháp thu thập dữ liệu thông qua “scraping” đang được chú trọng. Scraping rất tiện lợi vì có thể sử dụng dễ dàng ngay cả khi không có đủ dữ liệu tích lũy trong công ty. Tuy nhiên, tùy vào cách sử dụng, nó có thể trở thành hành vi phiền nhiễu hoặc hành vi phạm pháp. Khi sử dụng scraping, việc hiểu rõ vấn đề pháp lý liên quan đến scraping là rất quan trọng.
Do đó, trong bài viết này, chúng tôi sẽ giải thích về các vấn đề pháp lý liên quan đến scraping dành cho các doanh nghiệp đang xem xét việc sử dụng scraping.
Khái niệm về Scraping
Scraping là một thuật ngữ máy tính xuất phát từ từ tiếng Anh “Scraping”, có nghĩa là “cạo” hoặc “gom nhặt”. Đây là công nghệ để trích xuất, thu thập dữ liệu và thông tin từ các trang web hoặc chương trình cụ thể.
Đôi khi nó cũng được gọi là Web Scraping, Web Crawler, hoặc Web Spider.
Trong những năm gần đây, do giá trị của dữ liệu và thông tin ngày càng tăng, nhiều công ty đã bắt đầu sử dụng Scraping để trích xuất, thu thập dữ liệu và thông tin.
Cụ thể, đầu tiên, chúng tôi sẽ thực hiện việc trích xuất, thu thập thông tin cần thiết thông qua Scraping.
Tiếp theo, chúng tôi sẽ phân tích dữ liệu đã thu thập và tạo cơ sở dữ liệu theo mục đích của việc Scraping.
Sau đó, chúng tôi sẽ cung cấp cơ sở dữ liệu cho khách hàng hoặc sử dụng nó cho công việc kinh doanh của chính công ty.
Các trường hợp scraping dữ liệu gặp vấn đề pháp lý
Scraping dữ liệu không phải lúc nào cũng gây ra vấn đề pháp lý, nhưng có những trường hợp cụ thể có thể gây ra vấn đề pháp lý.
Dưới đây, chúng tôi sẽ giới thiệu một số trường hợp có thể gây ra vấn đề pháp lý.
Trường hợp vi phạm điều khoản sử dụng cấm scraping
Khi sử dụng một trang web cụ thể, nếu bạn đã đồng ý với điều khoản sử dụng của trang web đó, bạn cần tuân theo điều khoản sử dụng.
Nếu điều khoản sử dụng có chứa điều khoản cấm scraping, thì người đã đồng ý với điều khoản sử dụng không thể vi phạm điều khoản sử dụng để thực hiện scraping.
Nếu bạn vi phạm điều khoản sử dụng để thực hiện scraping, bạn có thể bị truy cứu trách nhiệm dân sự như yêu cầu bồi thường thiệt hại hoặc ngăn chặn scraping từ người quản lý trang web do vi phạm nghĩa vụ hoặc hành vi pháp lý không hợp lệ.
https://monolith.law/corporate/web-terms-of-service-part1[ja]
Trường hợp vi phạm luật bản quyền
Có những trường hợp dữ liệu hoặc nội dung trên một trang web cụ thể được công nhận quyền tác giả, và nếu quyền tác giả được công nhận, nó sẽ được bảo vệ theo luật bản quyền.
Do đó, khi thực hiện scraping, bạn cần chú ý để không vi phạm luật bản quyền.
Quyền tác giả là gì
Quyền tác giả là quyền bảo vệ tác phẩm.
Tác phẩm là những thứ biểu thị ý tưởng hoặc cảm xúc một cách sáng tạo, thuộc về lĩnh vực văn học, học thuật, nghệ thuật hoặc âm nhạc (Điều 2, Khoản 1, Mục 1 của Luật Bản quyền Nhật Bản).
Trường hợp dữ liệu hoặc nội dung thực hiện scraping không được công nhận quyền tác giả
Nếu dữ liệu hoặc nội dung trên một trang web cụ thể được công nhận quyền tác giả, nó sẽ được bảo vệ theo luật bản quyền, nhưng ngược lại, nếu nó chỉ là dữ liệu đơn giản, nó sẽ không được bảo vệ theo luật bản quyền nếu quyền tác giả không được công nhận.
Do đó, khi sử dụng scraping, bạn cần xác định loại dữ liệu nào sẽ được thu thập và xem xét liệu quyền tác giả có được công nhận hay không.
Trường hợp dữ liệu hoặc nội dung thực hiện scraping được công nhận quyền tác giả
Nếu dữ liệu hoặc nội dung thực hiện scraping được công nhận quyền tác giả, nó sẽ được bảo vệ theo luật bản quyền.
Khi thực hiện scraping, nếu công việc sao chép dữ liệu hoặc nội dung được thực hiện mà không có sự đồng ý của người sở hữu quyền, có thể vi phạm quyền sao chép (Điều 21 của Luật Bản quyền Nhật Bản) và các quyền khác của người sở hữu quyền.
Tuy nhiên, nếu thuộc về trường hợp được thêm vào theo sửa đổi Luật Bản quyền, Điều 30, Khoản 4 (sử dụng không nhằm mục đích tận hưởng ý tưởng hoặc cảm xúc được biểu thị trong tác phẩm), nó sẽ không vi phạm quyền tác giả.
Ngoài ra, nếu thuộc về trường hợp Điều 47, Khoản 5 của Luật Bản quyền Nhật Bản (sử dụng nhẹ nhàng liên quan đến xử lý thông tin bằng máy tính và cung cấp kết quả), nó cũng không vi phạm quyền tác giả.
Trường hợp gây ra tải trọng lớn lên máy chủ
Việc thực hiện scraping có thể gây ra tải trọng lớn lên trang web, làm cho máy chủ bị down và không thể xem hoặc hiển thị trang web.
Trong trường hợp này, do máy chủ của trang web mục tiêu bị down, công ty hoặc tổ chức quản lý trang web đó có thể không thể hoạt động, và có thể bị truy cứu tội phạm gây rối hoạt động kinh doanh bằng cách lừa dối (Điều 233 của Bộ luật Hình sự Nhật Bản) hoặc tội phạm gây rối hoạt động bằng cách phá hủy máy tính điện tử (Điều 234-2 của Bộ luật Hình sự Nhật Bản).
Trường hợp vi phạm Luật bảo vệ thông tin cá nhân
Có thể xem xét trường hợp thu thập thông tin cá nhân bằng cách scraping.
Khi thu thập thông tin cá nhân, bạn cần thông báo mục đích sử dụng cho người đó. Tuy nhiên, việc thông báo mục đích sử dụng cho mỗi người cụ thể không phải là thực tế.
Do đó, nếu bạn dự định thực hiện scraping và thu thập thông tin cá nhân, bạn cần công bố chính sách bảo mật hoặc chính sách bảo vệ thông tin cá nhân, và làm rõ mục đích sử dụng.
Lưu ý rằng, đối với thông tin cá nhân cần đặc biệt chú ý trong việc xử lý, như chủng tộc, tín ngưỡng, tình trạng xã hội, lịch sử bệnh tật, lịch sử tội phạm (thông tin cá nhân cần chú ý), chỉ việc công bố chính sách bảo mật hoặc chính sách bảo vệ thông tin cá nhân không đủ để thu thập, bạn cần có sự đồng ý của người đó, vì vậy hãy cẩn thận.
Ngoài ra, cũng có thể xem xét trường hợp tạo cơ sở dữ liệu thông tin cá nhân thu thập bằng cách scraping và cung cấp cho bên thứ ba.
Tuy nhiên, khi cung cấp cho bên thứ ba, nguyên tắc là bạn cần có sự đồng ý của người đó trước (Điều 27 của Luật bảo vệ thông tin cá nhân Nhật Bản), vì vậy hãy chú ý đến điểm này.
Vụ việc thực tế mà việc scraping đã trở thành vấn đề
Một ví dụ về việc scraping trở thành vấn đề thực tế là sự cố tại Thư viện Trung tâm Thành phố Okazaki xảy ra vào khoảng tháng 3 năm 2010 (năm 22 của thời kỳ Heisei).
Đây là sự cố khi hệ thống tìm kiếm sách trong thư viện của Thư viện Trung tâm Thành phố Okazaki gặp phải sự cố truy cập, và sau đó được xác định rằng nguyên nhân của sự cố truy cập là do scraping. Người đàn ông đã thực hiện việc scraping đã bị bắt vì nghi ngờ gây rối hoạt động kinh doanh bằng cách lừa dối.
Người đàn ông bị bắt là người sử dụng Thư viện Trung tâm Thành phố Okazaki, nhưng anh ta không hài lòng với sự tiện lợi của hệ thống sách trong thư viện của Thư viện Trung tâm Thành phố Okazaki, và đã truy cập vào hệ thống sách trong thư viện và rút dữ liệu từ hệ thống sách trong thư viện.
Người đàn ông bị bắt đã bị giam giữ trong 20 ngày, nhưng cuối cùng, do không thể xác nhận ý định mạnh mẽ gây rối hoạt động của Thư viện Trung tâm Thành phố Okazaki, anh ta đã được xử lý bằng cách hoãn việc khởi tố.
Trong vụ việc này, anh ta đã nhận được hình phạt tương đối nhẹ là việc hoãn việc khởi tố, nhưng tùy thuộc vào nội dung của việc scraping, có thể sẽ nhận được hình phạt nặng nên cần phải cẩn thận.
Tóm tắt
Chúng tôi đã giải thích về các vấn đề pháp lý liên quan đến việc sử dụng công cụ scraping dành cho những doanh nghiệp đang có ý định sử dụng công cụ này.
Việc có phát sinh vấn đề pháp lý trong quá trình sử dụng công cụ scraping hay không phụ thuộc vào cách sử dụng của bạn. Do đó, nếu bạn sử dụng công cụ scraping một cách vội vàng mà không tìm hiểu kỹ, có thể sẽ gặp phải các vấn đề pháp lý. Vì vậy, bạn cần phải cẩn thận.
Để đánh giá xem việc sử dụng công cụ scraping có phát sinh vấn đề pháp lý hay không, bạn cần có kiến thức chuyên môn. Do đó, chúng tôi khuyến nghị những doanh nghiệp đang có ý định sử dụng công cụ scraping nên tham vấn với luật sư có kiến thức chuyên môn.
Giới thiệu về các biện pháp của văn phòng luật sư của chúng tôi
Văn phòng luật sư Monolis, chuyên về IT, đặc biệt là Internet và luật, là một văn phòng luật sư có chuyên môn cao trong cả hai lĩnh vực này. Gần đây, việc sử dụng web scraping đang thu hút sự chú ý và cần phải thận trọng. Nhu cầu kiểm tra pháp lý ngày càng tăng. Văn phòng luật sư của chúng tôi phân tích rủi ro pháp lý liên quan đến doanh nghiệp đã bắt đầu hoặc đang chuẩn bị bắt đầu, dựa trên các quy định của nhiều loại luật, và cố gắng hợp pháp hóa doanh nghiệp mà không cần phải dừng lại. Chi tiết được mô tả trong bài viết dưới đây.