Adakah Pengambilan Imej di Internet Melanggar Undang-Undang Hak Cipta? Penjelasan Mengenai Isu Hukum dalam Pembelajaran Mesin
Dalam beberapa tahun terakhir, kemajuan teknologi AI (Kecerdasan Buatan) sangat menakjubkan, dan berbagai AI seperti AI pembuat gambar seperti ‘Stable Diffusion’ dan ‘Midjourney’, serta ‘ChatGPT’ yang menghasilkan teks dan sebagainya, telah menarik perhatian. Dengan merangkak data di internet dan membiarkannya belajar oleh AI, berbagai hal dapat dilakukan dengan menggunakan AI, dan ketepatan pembelajaran mesin meningkat, namun risiko pelanggaran undang-undang hak cipta telah dinyatakan.
Apakah mengumpulkan dan memproses berbagai data seperti gambar dan ilustrasi yang dipublikasikan di internet tanpa izin, dan menggunakannya untuk pembelajaran mesin AI, tidak melanggar hak cipta?
Artikel ini akan menjelaskan masalah hukum yang terkait dengan penggunaan gambar dan ilustrasi yang dipublikasikan di internet untuk pembelajaran mesin.
Apakah itu Pembelajaran Mesin
Pembelajaran Mesin (ML: Machine Learning) merujuk kepada proses di mana mesin belajar dari data, sama seperti manusia belajar dari pengalaman. Dalam proses pembelajaran mesin, perlu mengumpulkan data, memilih dan memproses data tersebut, dan membuat set data untuk pembelajaran.
Crawling merujuk kepada proses di mana program yang dikenali sebagai crawler melawat laman web dan menyalin serta menyimpan maklumat seperti teks dan gambar yang terdapat pada laman web tersebut.
Artikel Berkaitan: Apakah itu Scraping? Menjelaskan isu-isu undang-undang metode pengumpulan data yang berguna dan menarik perhatian
Isu-isu dalam Hukum Hak Cipta dalam Pembelajaran Mesin
“Hak cipta”, secara ringkas, merujuk kepada hak untuk melindungi karya secara undang-undang. Mengenai “karya” yang dilindungi, ia ditentukan dalam Perkara 2, Perenggan 1 dalam Undang-Undang Hak Cipta Jepun (Japanese Copyright Law) seperti berikut:
(Definisi)
Perkara Kedua: Dalam undang-undang ini, makna istilah yang disenaraikan di bawah ditentukan mengikut apa yang ditetapkan dalam setiap perenggan.
Pertama: Karya – merujuk kepada ekspresi kreatif pemikiran atau perasaan dalam bidang sastera, akademik, seni atau muzik.
Latar Belakang Pindaan Undang-Undang Hak Cipta Jepun Tahun Heisei 30 (2018)
Pada tahun 2018 (Tahun Heisei 30), Undang-Undang Hak Cipta Jepun telah dipinda dan mulai dikuatkuasakan pada 1 Januari 2019 (Tahun Heisei 31).
Untuk memanfaatkan teknologi seperti IoT, Big Data, dan AI (Kecerdasan Buatan), adalah penting untuk membolehkan pengumpulan, penggabungan, dan analisis maklumat dalam jumlah besar termasuk karya. Oleh itu, dalam pindaan ini, peruntukan telah dibuat untuk membenarkan penggunaan karya dalam keadaan tertentu seperti bukan untuk tujuan menikmati karya tersebut.
Apa yang Dibenarkan dalam Perkara 30 (4) Undang-Undang Hak Cipta Jepun
Dalam Perkara 30 (4) Undang-Undang Hak Cipta Jepun yang dipinda pada tahun 2018, “penggunaan yang tidak bertujuan untuk menikmati pemikiran atau perasaan yang dinyatakan dalam karya” dibenarkan dalam lingkungan yang dianggap perlu, tanpa mengira cara, untuk menggunakan karya tersebut.
(Penggunaan yang Tidak Bertujuan untuk Menikmati Pemikiran atau Perasaan yang Dinyatakan dalam Karya)
Perkara 30 (4): Karya boleh digunakan dalam kes berikut dan dalam kes lain di mana tujuannya bukan untuk menikmati pemikiran atau perasaan yang dinyatakan dalam karya tersebut sendiri atau membiarkan orang lain menikmatinya, dalam lingkungan yang dianggap perlu, tanpa mengira cara penggunaannya. Walau bagaimanapun, ini tidak berlaku jika, mengambil kira jenis dan tujuan karya tersebut dan cara penggunaannya, ia akan merosakkan kepentingan pemegang hak cipta secara tidak adil.
Pertama: Dalam kes di mana ia digunakan untuk tujuan ujian untuk pembangunan atau penggunaan praktikal teknologi yang berkaitan dengan penggunaan karya seperti merakam atau merakam video.
Kedua: Dalam kes di mana ia digunakan untuk tujuan analisis maklumat (merujuk kepada proses mengekstrak maklumat yang berkaitan dengan elemen seperti bahasa, bunyi, dan imej dari sejumlah besar karya dan maklumat lain, dan melakukan perbandingan, pengelasan, dan analisis lain. Sama seperti dalam Perkara 47 (5) Perenggan 1 No. 2).
Ketiga: Selain dari kes yang disenaraikan dalam dua perenggan sebelumnya, dalam kes di mana karya digunakan dalam proses pemprosesan maklumat oleh komputer atau penggunaan lain tanpa pengenalan manusia terhadap ekspresi karya (kecuali untuk pelaksanaan karya program dalam komputer).
Secara khusus, penggunaan karya dibenarkan dalam kes-kes seperti berikut:
・Tindakan meniru karya seni secara percubaan untuk membangunkan kamera atau pencetak yang sesuai untuk penggandaan karya seni.
・Tindakan mengumpul dan menggunakan karya sebagai data pembelajaran untuk pembangunan kecerdasan buatan, atau memberikan data pembelajaran yang dikumpul kepada pihak ketiga di bawah tujuan pembangunan kecerdasan buatan (seperti penyerahan atau penghantaran awam).
・Tindakan menggunakan karya dalam proses pemprosesan maklumat komputer di belakang tabir, di mana data tersebut digunakan tanpa pengetahuan manusia sama sekali.
・Tindakan menggunakan karya program untuk tujuan penyelidikan dan analisis program (dikenali sebagai “reverse engineering”).
Kes di mana penggunaan karya dalam pembelajaran mesin boleh melanggar undang-undang hak cipta
Seperti yang kita ketahui, pengumpulan, pemprosesan, dan penggunaan gambar (karya) untuk pembelajaran mesin, serta penyediaan data pembelajaran yang dikumpulkan kepada pihak ketiga (penjualan, pemindahan, dll.) adalah diiktiraf di bawah Perkara 30-4(2) Undang-Undang Hak Cipta Jepun. Walau bagaimanapun, penggunaan karya seperti ini boleh membawa kepada masalah undang-undang.
Di sini, kita akan membincangkan masalah undang-undang yang mungkin timbul apabila menggunakan gambar yang diterbitkan di internet untuk pembelajaran mesin.
Artikel berkaitan: Sejauh mana maklumat di internet boleh digunakan? Penjelasan tentang hak cipta di internet
Apabila kepentingan pemegang hak cipta dirugikan secara tidak adil
Di bawah Perkara 30-4 Undang-Undang Hak Cipta Jepun, “penggunaan yang tidak bertujuan untuk menikmati idea atau perasaan yang dinyatakan dalam karya” diiktiraf, tetapi penggunaan karya tidak diiktiraf jika ia merugikan kepentingan pemegang hak cipta secara tidak adil.
Apakah kes yang boleh dipertimbangkan secara khusus? Menurut Q&A Agensi Budaya, kes berikut dianggap “merugikan kepentingan pemegang hak cipta secara tidak adil”.
Walaupun keputusan akhir dibuat di mahkamah, misalnya, jika karya pangkalan data yang mengatur sejumlah besar maklumat dengan mudah untuk analisis maklumat dijual, tindakan menyalin dan sebagainya pangkalan data tersebut untuk tujuan analisis maklumat dianggap “merugikan kepentingan pemegang hak cipta secara tidak adil” kerana ia bertentangan dengan pasaran penjualan pangkalan data tersebut.
Petikan: Bahagian Hak Cipta Agensi Budaya | “Pandangan asas tentang peraturan pembatasan hak yang fleksibel untuk menghadapi kemajuan digitalisasi dan rangkaian”
Apabila perjanjian yang berbeza dengan peruntukan undang-undang hak cipta dibuat
Walaupun Undang-Undang Hak Cipta Jepun membenarkan penggunaan karya dalam pembelajaran mesin, perjanjian yang berbeza boleh dibuat antara pihak-pihak yang terlibat. Jika perjanjian seperti ini telah dibuat, anda mungkin akan dituntut tanggungjawab ganti rugi dan sebagainya jika anda melanggar perjanjian tersebut.
Contohnya, terdapat laman web yang secara eksplisit melarang pengumpulan dan pengekstrakan data untuk pembelajaran mesin dan analisis maklumat dalam terma penggunaan dan perjanjian lesen mereka. Anda perlu memeriksa terma penggunaan dan perjanjian lesen laman web tersebut sebelum mengumpulkan data.
Secara umumnya, untuk “bersetuju” dengan terma penggunaan laman web, anda perlu melakukan beberapa tindakan. Misalnya, anda mungkin diminta untuk mendaftar atau menekan butang persetujuan bersama dengan pernyataan seperti “Dengan membuat akaun, anda dianggap bersetuju dengan Terma Penggunaan dan Dasar Privasi”. Dengan mengklik pendaftaran atau butang persetujuan, “perjanjian” dianggap telah dibuat.
Sebaliknya, jika terma penggunaan yang melarang pengumpulan dan pengekstrakan data hanya dipaparkan di halaman lain daripada halaman muat turun dan anda boleh memuat turun gambar tanpa bersetuju dengannya, “perjanjian” dianggap tidak dibuat. Dalam kes ini, peruntukan undang-undang hak cipta akan digunakan, dan anda boleh menggunakan karya tersebut.
Walau bagaimanapun, untuk mengelakkan masalah, anda harus mengelakkan pengumpulan data dari laman web yang secara eksplisit melarang pengumpulan dan pengekstrakan data dalam terma penggunaan mereka.
Artikel berkaitan: Apa itu scraping? Penjelasan tentang isu undang-undang metode pengumpulan data yang menarik perhatian
Adakah Imej yang Dicipta Melalui Pembelajaran Mesin Melanggar Undang-Undang Hak Cipta?
Sehingga kini, kami telah menjelaskan bahawa penggunaan karya cipta dalam pembelajaran mesin adalah sesuatu yang diakui dalam undang-undang hak cipta. Jadi, adakah pembuatan imej sintetik oleh AI melalui pembelajaran mesin, melanggar hak cipta imej asal (foto, ilustrasi, lukisan, dll.) yang digunakan sebagai bahan pembelajaran?
Di sini, kami akan menjelaskan berdasarkan contoh kes di mana AI menghasilkan imej melalui GAN (Generative Adversarial Networks).
Mekanisme Penghasilan Imej Melalui Pembelajaran Mesin
GAN (Generative Adversarial Networks) adalah salah satu jenis model generatif yang dapat menghasilkan data yang tidak wujud atau mengubah data yang ada berdasarkan ciri-ciri yang dipelajari dari data. Mekanisme penghasilan imej melalui GAN ini, misalnya, digunakan dalam perkhidmatan yang menghasilkan imej sintetik seolah-olah perabot yang disesuaikan dengan bajet dan saiz bilik diletakkan di dalam foto atau lukisan bilik sebenar.
Adakah AI yang Telah Belajar dari Imej Asal Boleh Melanggar Hak Cipta Imej Asal?
GAN terdiri daripada dua rangkaian neural, iaitu Generator dan Discriminator. Dalam ini, Generator membaca ciri-ciri imej asal dalam bentuk numerik dan memasukkan beberapa pembolehubah ke dalamnya, menghasilkan nilai yang disesuaikan dengan pembolehubah tersebut dan mencipta imej sintetik.
Jadi, imej sintetik adalah imej yang dihasilkan baru sebagai hasil dari memasukkan pembolehubah ke dalam fungsi semasa proses sintesis, dan boleh dikatakan sepenuhnya berbeza dari data imej asal (foto, ilustrasi, lukisan, dll.). Walaupun hasil pembelajaran mesin mungkin menghasilkan imej yang serupa dengan imej asal, ini tidak dianggap sebagai penggandaan, adaptasi, atau modifikasi data pembelajaran asal.
Oleh itu, boleh dikatakan bahawa imej sintetik yang dihasilkan oleh AI melalui pembelajaran mesin tidak melanggar hak cipta imej asal pembelajaran mesin.
Artikel berkaitan: Bagaimana Hak Kekayaan Intelektual Dipertahankan dalam Pembangunan AI? Mengatur Isu Hak Cipta dan Hak Paten
Ringkasan: Rujuk kepada peguam untuk isu hak cipta dan pembelajaran mesin AI
Dalam artikel ini, kami telah menerangkan tentang isu hak cipta yang berkaitan dengan penggunaan gambar yang diterbitkan di internet untuk pembelajaran mesin AI.
Penggunaan karya cipta untuk pembelajaran mesin adalah diterima dalam undang-undang hak cipta (Pasal 30(4) Undang-Undang Hak Cipta Jepun). Walau bagaimanapun, secara pengecualian, terdapat kes di mana penggunaan karya cipta tidak dibenarkan jika ia merosakkan kepentingan pemegang hak cipta secara tidak adil atau jika persetujuan yang berbeza dengan peruntukan undang-undang hak cipta telah dibuat antara pihak-pihak yang terlibat.
AI seperti ‘Midjourney’, ‘Stable Diffusion’, dan ‘ChatGPT’ mendapat perhatian, dan bilangan syarikat yang mula membangunkan AI semakin meningkat. Adakah karya cipta boleh digunakan sebagai data pembelajaran yang penting untuk pembangunan AI adalah suatu isu yang sukar untuk ditentukan. Oleh itu, kami menyarankan anda untuk merujuk kepada peguam yang berpengalaman dalam bidang IT jika anda ingin menjalankan perniagaan yang menggunakan AI dan pembelajaran mesin.
Penerangan Mengenai Langkah-langkah oleh Firma Kami
Firma guaman Monolith adalah sebuah firma guaman yang mempunyai pengalaman luas dalam kedua-dua bidang IT, khususnya internet dan undang-undang.
Bisnes AI membawa banyak risiko undang-undang, dan sokongan dari peguam yang mahir dalam isu-isu undang-undang berkaitan AI adalah penting. Firma kami, dengan pasukan peguam yang mahir dalam AI dan jurutera, menyediakan sokongan undang-undang yang canggih untuk bisnes AI termasuk ChatGPT, seperti pembuatan kontrak, penilaian kesahihan model bisnes, perlindungan hak cipta intelektual, dan penanganan privasi. Butiran lanjut dinyatakan dalam artikel di bawah.
Bidang yang ditangani oleh Firma Guaman Monolith: Undang-undang AI (seperti ChatGPT)
Category: IT