Việc lục lọi hình ảnh trên mạng có vi phạm luật bản quyền không? Giải thích vấn đề pháp lý của học máy
Gần đây, sự tiến bộ của công nghệ AI (Trí tuệ nhân tạo) đang ngày càng nổi bật, với sự chú ý dành cho nhiều AI như “Stable Diffusion” và “Midjourney”, những AI tạo hình ảnh, cũng như “ChatGPT”, AI tạo ra văn bản và các nội dung khác. Bằng cách thu thập dữ liệu trên mạng và cho AI học hỏi từ đó, chúng ta có thể làm được nhiều việc bằng AI, và độ chính xác của học máy đang được cải thiện. Tuy nhiên, cũng có những rủi ro vi phạm luật bản quyền được chỉ ra.
Việc thu thập không xin phép và sử dụng các dữ liệu như hình ảnh và minh họa được công bố trên mạng để xử lý và sử dụng cho học máy của AI có phải là vi phạm quyền tác giả không?
Bài viết này sẽ giải thích về các vấn đề pháp lý liên quan đến việc sử dụng hình ảnh và minh họa được công bố trên mạng cho học máy.
Học máy là gì
Học máy (ML: Machine Learning) là quá trình máy móc học từ dữ liệu giống như cách con người học từ kinh nghiệm. Trong quá trình học máy, cần phải thu thập dữ liệu, chọn lọc và xử lý dữ liệu đó để tạo ra bộ dữ liệu dùng cho việc học.
Crawling là quá trình mà chương trình được gọi là crawler đi qua các trang web, sao chép và lưu trữ thông tin như văn bản hay hình ảnh trên trang web.
Bài viết liên quan: Scraping là gì? Giải thích vấn đề pháp lý của phương pháp thu thập dữ liệu tiện lợi đang thu hút sự chú ý[ja]
Vấn đề về luật bản quyền trong học máy
“Bản quyền”, nói một cách đơn giản, là quyền pháp lý để bảo vệ tác phẩm. Và về “tác phẩm” được bảo vệ, điều này được quy định trong Điều 2, Khoản 1 của Luật Bản quyền Nhật Bản như sau:
(Định nghĩa)
Điều thứ hai: Trong luật này, ý nghĩa của các thuật ngữ được liệt kê dưới đây được xác định theo từng mục.
Một: Tác phẩm là sự biểu đạt sáng tạo của tư duy hoặc cảm xúc, thuộc về lĩnh vực văn học, học thuật, nghệ thuật hoặc âm nhạc.
Bối cảnh sửa đổi Luật Bản quyền Nhật Bản năm 2018 (Heisei 30)
Năm 2018 (Heisei 30), Luật Bản quyền Nhật Bản đã được sửa đổi và bắt đầu có hiệu lực từ ngày 1 tháng 1 năm 2019 (Heisei 31).
Để tận dụng các công nghệ như IoT, Big Data, AI (Trí tuệ nhân tạo), cần phải có khả năng tích lũy, kết hợp và phân tích lượng lớn thông tin bao gồm tác phẩm. Do đó, trong sửa đổi này, quy định cho phép sử dụng tác phẩm trong một số trường hợp nhất định, như không sử dụng tác phẩm với mục đích thưởng thức, đã được thiết lập.
Phương pháp sử dụng được công nhận trong Điều 30, Khoản 4 của Luật Bản quyền Nhật Bản
Trong Điều 30, Khoản 4 của Luật Bản quyền Nhật Bản đã được sửa đổi vào năm 2018, “sử dụng không nhằm mục đích thưởng thức tư duy hoặc cảm xúc được biểu đạt trong tác phẩm” được công nhận trong phạm vi cần thiết, không phụ thuộc vào phương pháp, tác phẩm có thể được sử dụng.
(Sử dụng không nhằm mục đích thưởng thức tư duy hoặc cảm xúc được biểu đạt trong tác phẩm)
Điều 30, Khoản 4: Trong trường hợp tác phẩm được liệt kê dưới đây hoặc trường hợp khác không nhằm mục đích thưởng thức tư duy hoặc cảm xúc được biểu đạt trong tác phẩm bởi chính mình hoặc người khác, tác phẩm có thể được sử dụng trong phạm vi được công nhận là cần thiết, không phụ thuộc vào phương pháp nào. Tuy nhiên, điều này không áp dụng trong trường hợp, dựa trên loại và mục đích của tác phẩm cũng như cách sử dụng, có thể gây tổn hại không công bằng đến lợi ích của người sở hữu bản quyền.
Một: Trường hợp sử dụng tác phẩm cho mục đích thử nghiệm để phát triển hoặc thực hành công nghệ liên quan đến việc ghi âm, ghi hình hoặc sử dụng tác phẩm khác
Hai: Trường hợp sử dụng tác phẩm cho mục đích phân tích thông tin (tức là việc trích xuất thông tin liên quan đến ngôn ngữ, âm thanh, hình ảnh hoặc các yếu tố khác tạo nên thông tin từ nhiều tác phẩm hoặc lượng lớn thông tin khác, và tiến hành so sánh, phân loại hoặc phân tích khác. Điều 47, Khoản 5, Mục 1, Mục 2 cũng áp dụng tương tự.)
Ba: Trong trường hợp không liên quan đến việc nhận biết biểu đạt của tác phẩm thông qua cảm nhận của con người, sử dụng tác phẩm trong quá trình xử lý thông tin bằng máy tính hoặc sử dụng khác (trừ việc thực hiện tác phẩm chương trình trên máy tính đối với tác phẩm chương trình.)
Cụ thể, trong các trường hợp sau đây, việc sử dụng tác phẩm được công nhận:
・Hành động sao chép tác phẩm nghệ thuật một cách thử nghiệm để phát triển máy ảnh hoặc máy in phù hợp cho việc sao chép tác phẩm nghệ thuật
・Hành động thu thập và sử dụng tác phẩm như dữ liệu học cho việc phát triển trí tuệ nhân tạo, hoặc cung cấp (chuyển nhượng hoặc phát sóng công cộng, v.v.) dữ liệu học đã thu thập dưới mục đích phát triển trí tuệ nhân tạo cho bên thứ ba
・Hành động sao chép tác phẩm trong quá trình xử lý thông tin của máy tính ở phía sau hậu trường và sử dụng dữ liệu đó mà không có con người nhận biết gì cả
・Hành động sử dụng tác phẩm chương trình với mục đích điều tra, phân tích (còn được gọi là “kỹ thuật đảo ngược”)
Trích dẫn: Cơ quan Văn hóa Nhật Bản|Về Luật sửa đổi một phần của Luật Bản quyền (Luật số 30 năm 2018)[ja]
Các trường hợp vi phạm luật bản quyền khi sử dụng tác phẩm trong học máy
Điều này có nghĩa là, việc thu thập, xử lý và sử dụng hình ảnh (tác phẩm) cho học máy, cũng như việc cung cấp (bán hoặc chuyển nhượng) dữ liệu học thu thập cho bên thứ ba, được công nhận trong Điều 30-4, Điểm 2 của Luật Bản quyền Nhật Bản. Tuy nhiên, việc sử dụng tác phẩm như vậy có thể dẫn đến rắc rối pháp lý.
Ở đây, chúng ta sẽ xem xét các vấn đề pháp lý có thể xảy ra khi thu thập hình ảnh được công bố trên mạng để sử dụng trong học máy.
Bài viết liên quan: Đến đâu có thể sử dụng thông tin trên Internet? Giải thích về bản quyền trên mạng[ja]
Trường hợp gây tổn hại không công bằng cho lợi ích của người sở hữu bản quyền
Trong Điều 30-4 của Luật Bản quyền Nhật Bản, “việc sử dụng không nhằm mục đích tận hưởng ý tưởng hoặc cảm xúc được biểu thị trong tác phẩm” được công nhận, nhưng việc sử dụng đó gây tổn hại không công bằng cho lợi ích của người sở hữu bản quyền thì không được công nhận.
Cụ thể, trường hợp nào có thể xảy ra? Theo Q&A của Cục Văn hóa Nhật Bản, các trường hợp sau đây được coi là “gây tổn hại không công bằng cho lợi ích của người sở hữu bản quyền”.
Quyết định cụ thể cuối cùng sẽ được đưa ra tại tòa án, nhưng ví dụ, trong trường hợp một cơ sở dữ liệu tác phẩm đã được sắp xếp dễ dàng để sử dụng trong phân tích thông tin và được bán, việc sao chép cơ sở dữ liệu đó với mục đích phân tích thông tin có thể xung đột với thị trường bán cơ sở dữ liệu và được coi là “gây tổn hại không công bằng cho lợi ích của người sở hữu bản quyền”.
Trích dẫn: Cục Bản quyền, Bộ Văn hóa Nhật Bản | “Cách tiếp cận cơ bản với quy định giới hạn quyền linh hoạt đối với sự tiến bộ của số hóa và mạng lưới”[ja]
Trường hợp thỏa thuận khác với quy định của Luật Bản quyền
Luật Bản quyền Nhật Bản cho phép sử dụng tác phẩm trong học máy, nhưng các bên có thể thỏa thuận khác với điều này. Nếu một thỏa thuận như vậy đã được thiết lập, bạn có thể bị yêu cầu chịu trách nhiệm bồi thường thiệt hại nếu vi phạm thỏa thuận.
Ví dụ, có những trang web cấm rõ ràng việc thu thập và trích xuất dữ liệu cho học máy và phân tích thông tin trong điều khoản sử dụng hoặc điều khoản giấy phép của chúng. Khi thu thập dữ liệu, bạn cần kiểm tra điều khoản sử dụng và điều khoản giấy phép của trang web đó.
Nói chung, để “đồng ý” với điều khoản sử dụng của một trang web, bạn cần thực hiện một hành động nào đó. Ví dụ, “Bằng cách tạo tài khoản, bạn được coi là đã đồng ý với Điều khoản sử dụng và Chính sách bảo mật” cùng với yêu cầu đăng ký hoặc nhấn nút đồng ý. Bằng cách nhấp vào nút đăng ký hoặc đồng ý, bạn đã “đồng ý”.
Ngược lại, nếu chỉ đăng điều khoản sử dụng cấm thu thập và trích xuất dữ liệu trên một trang khác với trang tải xuống trong trang web và bạn có thể tải xuống hình ảnh mà không cần đồng ý với điều đó, thì “đồng ý” không được thiết lập. Trong trường hợp này, quy định của Luật Bản quyền Nhật Bản được áp dụng và bạn có thể sử dụng tác phẩm.
Tuy nhiên, để tránh rắc rối, bạn nên tránh thu thập dữ liệu từ các trang web cấm rõ ràng việc thu thập và trích xuất dữ liệu trong điều khoản sử dụng của chúng.
Bài viết liên quan: Scraping là gì? Giải thích vấn đề pháp lý của phương pháp thu thập dữ liệu tiện lợi đang thu hút sự chú ý[ja]
Hình ảnh tổng hợp bằng học máy có vi phạm luật bản quyền không?
Đến nay, chúng tôi đã giải thích rằng việc sử dụng tác phẩm trong học máy được công nhận trong luật bản quyền Nhật Bản. Vậy, liệu việc AI thực hiện học máy và tạo ra hình ảnh tổng hợp có vi phạm bản quyền của hình ảnh gốc (ảnh chụp, minh họa, tranh vẽ, v.v.) không?
Ở đây, chúng tôi sẽ giải thích dựa trên ví dụ về trường hợp AI tạo ra hình ảnh bằng GAN (Generative Adversarial Networks – Mạng đối kháng sinh học).
Cơ chế tạo hình ảnh bằng học máy
GAN (Generative Adversarial Networks – Mạng đối kháng sinh học) là một loại mô hình sinh, có thể tạo ra dữ liệu không tồn tại hoặc biến đổi dữ liệu hiện có theo đặc điểm học từ dữ liệu. Cơ chế tạo hình ảnh bằng GAN, ví dụ, được sử dụng trong các dịch vụ như phân tích ảnh hoặc tranh của phòng thực tế và tổng hợp hình ảnh như thể có đồ nội thất phù hợp với ngân sách và kích thước phòng đặt ở đó.
AI có thể vi phạm bản quyền của hình ảnh gốc mà nó đã học máy không?
GAN được cấu tạo từ hai mạng nơ-ron là Generator (Bộ sinh) và Discriminator (Bộ phân biệt). Trong đó, Generator đọc và số hóa đặc điểm của hình ảnh gốc, và bằng cách nhập một số biến đổi cố định, nó xuất ra một số đã được điều chỉnh bởi biến đổi đó để tạo ra hình ảnh tổng hợp.
Do đó, hình ảnh tổng hợp là hình ảnh mới được tạo ra như kết quả của việc nhập biến vào hàm trong quá trình tổng hợp, và có thể nói rằng nó hoàn toàn khác với dữ liệu hình ảnh gốc (ảnh chụp, minh họa, tranh vẽ, v.v.). Ngay cả khi hình ảnh tương tự với hình ảnh gốc được tổng hợp như kết quả của học máy, nó không được coi là sao chép, phiên bản hoặc sửa đổi dữ liệu học gốc.
Vì vậy, có thể nói rằng hình ảnh tổng hợp mà AI tạo ra thông qua học máy không vi phạm bản quyền của hình ảnh gốc mà nó đã học.
Bài viết liên quan: Bảo vệ quyền sở hữu trí tuệ trong phát triển AI như thế nào? Sắp xếp các vấn đề về bản quyền, quyền sở hữu trí tuệ[ja]
Tóm tắt: Hãy thảo luận với luật sư về vấn đề bản quyền trong học máy và AI
Trong bài viết này, chúng tôi đã giải thích về các vấn đề pháp lý liên quan đến việc sử dụng hình ảnh công khai trên mạng cho học máy của AI.
Việc sử dụng tác phẩm cho học máy được công nhận trong luật bản quyền (Điều 30-4 của Luật Bản quyền Nhật Bản). Tuy nhiên, có những trường hợp ngoại lệ, nếu việc sử dụng tác phẩm gây hại không công bằng cho lợi ích của người sở hữu bản quyền hoặc nếu các bên thỏa thuận điều gì đó khác với quy định của luật bản quyền, việc sử dụng tác phẩm có thể không được chấp nhận.
AI như “Midjourney”, “Stable Diffusion”, “ChatGPT” đang thu hút sự chú ý và số lượng công ty tiến vào phát triển AI đang tăng lên nhanh chóng. Vì việc xác định liệu có thể sử dụng tác phẩm như dữ liệu học tập không thể thiếu trong phát triển AI có thể khó khăn trong một số trường hợp, chúng tôi khuyên bạn nên thảo luận với một luật sư am hiểu về lĩnh vực IT khi tiến hành kinh doanh sử dụng AI và học máy.
Giới thiệu về các biện pháp của văn phòng luật sư của chúng tôi
Văn phòng luật sư Monolith, với kinh nghiệm phong phú về cả hai mặt của IT, đặc biệt là Internet và luật pháp.
Kinh doanh AI đi kèm với nhiều rủi ro pháp lý, và sự hỗ trợ của luật sư am hiểu vấn đề pháp lý liên quan đến AI là cần thiết. Văn phòng luật sư của chúng tôi, với đội ngũ bao gồm luật sư am hiểu AI và các kỹ sư, cung cấp hỗ trợ pháp lý cao cấp cho kinh doanh AI bao gồm ChatGPT, như việc soạn thảo hợp đồng, xem xét tính hợp pháp của mô hình kinh doanh, bảo vệ quyền sở hữu trí tuệ, và việc đối phó với vấn đề riêng tư. Chi tiết được mô tả trong bài viết dưới đây.
Lĩnh vực hoạt động của Văn phòng luật sư Monolith: Pháp lý AI (ChatGPT, v.v.)[ja]
Category: IT