क्या इंटरनेट पर छवियों की क्रॉलिंग सॉफ्टवेयर का उपयोग करना कॉपीराइट कानून का उल्लंघन है? मशीन लर्निंग के कानूनी मुद्दों की व्याख्या
हाल के वर्षों में, AI (कृत्रिम बुद्धि) तकनीक की प्रगति ने धूम मचा दी है, और ‘Stable Diffusion’ या ‘Midjourney’ जैसे छवि उत्पन्न करने वाले AI और ‘ChatGPT’ जैसे विभिन्न AI जो लेख आदि उत्पन्न करते हैं, ध्यान केंद्रित कर रहे हैं। इंटरनेट पर उपलब्ध डेटा को क्रॉल करके AI को सीखने के लिए उपयोग करने से, AI का उपयोग करके विभिन्न कार्य संभव हो गए हैं, और मशीन लर्निंग की सटीकता में सुधार हो रहा है, वहीं, कॉपीराइट लॉ (जापानी कॉपीराइट लॉ) का उल्लंघन करने का जोखिम उठाया गया है।
इंटरनेट पर प्रकाशित छवियों और चित्रों आदि के विभिन्न डेटा को क्रॉल करके बिना अनुमति के संग्रहित करना, और उसे संशोधित करके AI की मशीन लर्निंग के लिए उपयोग करना, क्या यह कॉपीराइट का उल्लंघन नहीं होता है?
इस लेख में, हम इंटरनेट पर प्रकाशित छवियों और चित्रों को मशीन लर्निंग के लिए उपयोग करने के कानूनी मुद्दों के बारे में विवरण देंगे।
मशीन लर्निंग क्या है
मशीन लर्निंग (ML: Machine Learning) वही होता है जैसे मनुष्य अनुभव से सीखता है, उसी तरह मशीन डेटा से सीखती है। मशीन लर्निंग की प्रक्रिया में, डेटा को इकट्ठा करने, उस डेटा का चयन और प्रसंस्करण करने, और सीखने के लिए डेटा सेट तैयार करने की आवश्यकता होती है।
क्रॉलिंग का मतलब होता है कि एक क्रॉलर नामक प्रोग्राम वेबसाइट को घूमता है, और वेब पेज पर मौजूद पाठ या छवियों जैसी जानकारी की प्रतिलिपि बनाता और सहेजता है।
संबंधित लेख: स्क्रेपिंग क्या है? डेटा संग्रहण की सुविधाजनक विधि के कानूनी मुद्दों की व्याख्या[ja]
मशीन लर्निंग में कॉपीराइट कानून के मुद्दे
“कॉपीराइट” सीधे शब्दों में कहें तो एक अधिकार है जो किसी रचना को कानूनी रूप से सुरक्षित करता है। और, सुरक्षित की जाने वाली “रचना” के बारे में, कॉपीराइट कानून की धारा 2 अनुच्छेद 1 में इस प्रकार का प्रावधान किया गया है।
(परिभाषा)
धारा दो। इस कानून में, निम्नलिखित प्रत्येक अनुच्छेद में उल्लिखित शब्दों का अर्थ, प्रत्येक अनुच्छेद में निर्धारित होता है।
एक। रचना: विचार या भावनाओं को सृजनात्मक रूप से व्यक्त करने वाली चीज़, जो साहित्य, विज्ञान, कला या संगीत के क्षेत्र में आती है।
हेसी 30 (2018) के कॉपीराइट कानून संशोधन का पृष्ठभूमि
2018 में (हेसी 30), संशोधित कॉपीराइट कानून पारित हुआ और 2019 में (हेसी 31) 1 जनवरी से लागू किया गया।
IoT, बिग डेटा, AI (आर्टिफिशियल इंटेलिजेंस) आदि तकनीकों का उपयोग करने के लिए, रचनाओं सहित बड़ी मात्रा में जानकारी को संचित, संयोजित और विश्लेषित करने की आवश्यकता होती है। इसलिए, इस संशोधन में, रचनाओं का उपयोग करने के लिए कुछ नियम बनाए गए हैं, जैसे कि रचनाओं का उपयोग न करने के लिए।
कॉपीराइट कानून की धारा 30 के 4 में मान्यता प्राप्त उपयोग क्या है
2018 में संशोधित कॉपीराइट कानून की धारा 30 के 4 में, “रचना में व्यक्त किए गए विचार या भावनाओं का आनंद लेने के उद्देश्य से नहीं” के लिए, आवश्यकतानुसार, तरीके को ध्यान में न लेते हुए, रचना का उपयोग करने की अनुमति दी गई है।
(रचना में व्यक्त किए गए विचार या भावनाओं का आनंद लेने के उद्देश्य से नहीं)
धारा 30 के 4। रचना का उपयोग, निम्नलिखित मामलों में और अन्य मामलों में, जहां रचना में व्यक्त किए गए विचार या भावनाओं का आनंद लेने का उद्देश्य नहीं होता है, उसकी आवश्यकता के अनुसार, किसी भी तरीके से, किया जा सकता है। हालांकि, रचना के प्रकार और उपयोग के साथ-साथ उसके उपयोग के तरीके को ध्यान में रखते हुए, यदि रचनाकार के हितों को अनुचित रूप से क्षति पहुंचती है, तो ऐसा नहीं होता है।
एक। रचना की रिकॉर्डिंग, वीडियो रिकॉर्डिंग और अन्य उपयोगों से संबंधित तकनीक के विकास या व्यावहारिक उपयोग के लिए परीक्षण के लिए उपयोग करने का मामला
दो। जानकारी विश्लेषण (बड़ी संख्या में रचनाओं और अन्य बड़ी मात्रा में जानकारी से, उस जानकारी को बनाने वाली भाषा, ध्वनि, छवि और अन्य तत्वों की जानकारी को निकालने, तुलना, वर्गीकरण और अन्य विश्लेषण करने के लिए उपयोग करने का मामला। धारा 47 के 5 के पहले अनुच्छेद के दूसरे नंबर में यही होता है।) के लिए उपयोग करने का मामला
तीन। पहले दो नंबरों के अलावा, रचना की अभिव्यक्ति के बारे में मनुष्य की संज्ञान के साथ जोड़े बिना उस रचना का उपयोग करने का मामला, जो कंप्यूटर द्वारा सूचना प्रसंस्करण की प्रक्रिया में होता है और अन्य उपयोग (प्रोग्राम की रचना के लिए, उस रचना के कंप्यूटर में निष्पादन को छोड़कर।) के लिए उपयोग करने का मामला
विशेष रूप से, निम्नलिखित प्रकार के मामलों में, रचना का उपयोग की अनुमति होती है।
• कला की नकल के लिए उपयुक्त कैमरा या प्रिंटर का विकास करने के लिए कला की परीक्षण नकल करने की क्रिया
• आर्टिफिशियल इंटेलिजेंस का विकास करने के लिए रचना को सीखने के डेटा के रूप में इकट्ठा करने और उपयोग करने, या इकट्ठा किए गए सीखने के डेटा को आर्टिफिशियल इंटेलिजेंस के विकास के उद्देश्य के तहत तीसरे पक्ष को प्रदान (हस्तांतरण या सार्वजनिक प्रेषण आदि) करने की क्रिया
• कंप्यूटर की सूचना प्रसंस्करण की प्रक्रिया में, बैकएंड में रचना की कॉपी करने और उस डेटा का उपयोग करने की क्रिया, जिसे मनुष्य बिल्कुल नहीं समझता है
• प्रोग्राम की जांच विश्लेषण के उद्देश्य से प्रोग्राम की रचना का उपयोग करने की क्रिया (जिसे “रिवर्स इंजीनियरिंग” कहा जाता है)
मशीन लर्निंग में कॉपीराइट सामग्री का उपयोग करने से कॉपीराइट उल्लंघन हो सकता है
इस प्रकार, छवियों (कॉपीराइट सामग्री) को मशीन लर्निंग के लिए संग्रहित, संशोधित और उपयोग करने के अलावा, संग्रहित डेटा को तीसरे पक्ष को प्रदान (बिक्री, हस्तांतरण आदि) करना भी जापानी कॉपीराइट अधिनियम धारा 30 के अंतर्गत स्वीकार किया जाता है। हालांकि, ऐसे कॉपीराइट सामग्री के उपयोग से कानूनी मुसीबत उत्पन्न हो सकती है।
यहां हम विचार करेंगे कि इंटरनेट पर प्रकाशित छवियों को संग्रहित करके मशीन लर्निंग में उपयोग करने पर क्या कानूनी समस्याएं उत्पन्न हो सकती हैं।
संबंधित लेख: इंटरनेट पर उपलब्ध जानकारी का कितना उपयोग किया जा सकता है? इंटरनेट कॉपीराइट के बारे में विवरण[ja]
कॉपीराइट धारक के लाभ को अनुचित रूप से क्षति पहुंचाने वाले मामले
जापानी कॉपीराइट अधिनियम धारा 30 के अंतर्गत, “विचारों या भावनाओं का आनंद लेने के उद्देश्य से कॉपीराइट सामग्री का उपयोग” स्वीकार किया जाता है, लेकिन यदि उसका उपयोग कॉपीराइट धारक के लाभ को अनुचित रूप से क्षति पहुंचाता है, तो कॉपीराइट सामग्री का उपयोग स्वीकार नहीं किया जाता है।
विशेष रूप से, कौन से मामले पर विचार किया जा सकता है? जापानी संस्कृति एजेंसी के प्रश्न और उत्तर के अनुसार, निम्नलिखित मामले “कॉपीराइट धारक के लाभ को अनुचित रूप से क्षति पहुंचाने वाले मामले” में शामिल हो सकते हैं।
विशेष निर्णय अंततः न्यायिक स्थल पर लिया जाता है, लेकिन उदाहरण के लिए, यदि बड़ी मात्रा में जानकारी को सूचना विश्लेषण के लिए आसानी से उपयोग करने योग्य रूप में व्यवस्थित डेटाबेस की कॉपीराइट सामग्री बिक्री के लिए उपलब्ध है, तो उस डेटाबेस को सूचना विश्लेषण के उद्देश्य से प्रतिलिपि आदि करने का कार्य, उस डेटाबेस की बिक्री के संबंध में बाजार के साथ संघर्ष करने वाला “कॉपीराइट धारक के लाभ को अनुचित रूप से क्षति पहुंचाने वाला मामला” में शामिल हो सकता है।
स्रोत: जापानी संस्कृति एजेंसी कॉपीराइट विभाग | “डिजिटलीकरण और नेटवर्किंग की प्रगति के प्रतिक्रिया में लचीले अधिकार सीमा नियमों के बारे में मूलभूत विचार”[ja]
कॉपीराइट अधिनियम के प्रावधानों से अलग समझौता करने के मामले
जापानी कॉपीराइट अधिनियम में, मशीन लर्निंग में कॉपीराइट सामग्री का उपयोग करने की अनुमति है, लेकिन पक्षों के बीच में इसके विपरीत समझौता करने की भी संभावना होती है। ऐसे समझौते के होने पर, समझौते के उल्लंघन करने पर क्षतिपूर्ति दायित्व आदि का सामना करने की संभावना होती है।
उदाहरण के लिए, साइट के उपयोग की शर्तों या लाइसेंस शर्तों में, मशीन लर्निंग या सूचना विश्लेषण के लिए डेटा संग्रहण और निष्कर्षण को स्पष्ट रूप से प्रतिबंधित करने वाली साइटें भी होती हैं। डेटा संग्रहण करते समय, आपको उस साइट के उपयोग की शर्तों और लाइसेंस शर्तों की जांच करने की आवश्यकता होती है।
सामान्यतः, साइट के उपयोग की शर्तों पर ‘सहमति’ करने के लिए, किसी प्रकार की क्रिया की आवश्यकता होती है। उदाहरण के लिए, “खाता बनाने के द्वारा, आप उपयोग की शर्तों और गोपनीयता नीति से सहमत होते हैं” जैसे प्रदर्शन के साथ, पंजीकरण या सहमति बटन दबाने की आवश्यकता होती है। पंजीकरण या सहमति बटन को क्लिक करने से ‘सहमति’ स्थापित हो जाती है।
वहीं, केवल डेटा संग्रहण और निष्कर्षण को प्रतिबंधित करने वाली उपयोग की शर्तें साइट के डाउनलोड पेज से अलग पेज पर प्रदर्शित करने के लिए, और उस पर सहमति नहीं करने पर भी छवियों को डाउनलोड करने की संभावना होती है, तो ‘सहमति’ स्थापित नहीं होती है। इस मामले में, कॉपीराइट अधिनियम के प्रावधान लागू होते हैं, और कॉपीराइट सामग्री का उपयोग करने की अनुमति होती है।
फिर भी, ट्रबल की रोकथाम के लिए, उपयोग की शर्तों में स्पष्ट रूप से डेटा संग्रहण और निष्कर्षण आदि को प्रतिबंधित करने वाली साइटों से डेटा संग्रहण का परहेज करना बेहतर होगा।
संबंधित लेख: स्क्रेपिंग क्या है? ध्यान केंद्रित करने वाले सुविधाजनक डेटा संग्रहण विधि के कानूनी मुद्दों का विवरण[ja]
क्या मशीन लर्निंग द्वारा संश्लेषित छवियाँ कॉपीराइट कानून का उल्लंघन करती हैं?
हमने अब तक यह समझाया है कि कॉपीराइट कानून के तहत कृतियों का मशीन लर्निंग में उपयोग करना मान्य है। तो, क्या AI द्वारा मशीन लर्निंग करके संश्लेषित छवियाँ बनाने से, उस छवि का कॉपीराइट उल्लंघन होता है जिस पर अध्ययन किया गया था (फोटो, चित्र, चित्रकारी आदि)?
यहां हम GAN (Generative Adversarial Networks) द्वारा छवि उत्पादन करने वाले AI के मामले का उदाहरण देकर समझाएंगे।
मशीन लर्निंग द्वारा छवि उत्पादन का तंत्र
GAN (Generative Adversarial Networks) एक प्रकार का उत्पादन मॉडल है, जो डेटा से विशेषताओं को सीखकर अस्तित्व में नहीं होने वाले डेटा का निर्माण करता है या मौजूदा डेटा की विशेषताओं के अनुसार परिवर्तन कर सकता है। इस GAN द्वारा छवि उत्पादन का तंत्र, उदाहरण के लिए, वास्तविक कमरे की तस्वीरों या चित्रों का विश्लेषण करके, बजट या कमरे के आकार के अनुसार फर्नीचर को वास्तव में वहां रखा जाता है जैसे छवियाँ संश्लेषित करने वाली सेवाओं में भी उपयोग किया जाता है।
क्या AI मशीन लर्निंग की मूल छवि का कॉपीराइट उल्लंघन कर सकता है?
GAN दो न्यूरल नेटवर्क, जनरेटर (Generator) और डिस्क्रिमिनेटर (Discriminator) द्वारा बनाया जाता है। इनमें से, जनरेटर मूल छवि की विशेषताओं को संख्यात्मक रूप में पढ़ता है और उसमें कुछ निर्धारित चर को इनपुट करके, उस चर द्वारा समायोजित संख्यात्मक मान को आउटपुट करके संश्लेषित छवि उत्पन्न करता है।
अर्थात, संश्लेषित छवियाँ, संश्लेषण की प्रक्रिया में फ़ंक्शन में चर को इनपुट करने के परिणामस्वरूप नई छवियाँ होती हैं, इसलिए यह कहा जा सकता है कि ये मूल छवि के डेटा (फोटो, चित्र, चित्रकारी आदि) से पूरी तरह अलग हैं। यदि मशीन लर्निंग के परिणामस्वरूप, मूल छवि के समान छवि संश्लेषित होती है, तो भी इसे मूल अध्ययन डेटा की प्रतिलिपि, अनुवाद या संशोधन माना नहीं जाता है।
इसलिए, इस प्रकार AI द्वारा मशीन लर्निंग करके उत्पन्न की गई संश्लेषित छवियाँ, मशीन लर्निंग की मूल छवि का कॉपीराइट उल्लंघन नहीं करती हैं।
संबंधित लेख: AI विकास में बौद्धिक संपदा कैसे सुरक्षित होती है? कॉपीराइट, पेटेंट के मुद्दों को सुलझाना[ja]
सारांश: AI की मशीन लर्निंग और कॉपीराइट के मुद्दों पर वकील से परामर्श करें
इस लेख में, हमने इंटरनेट पर प्रकाशित छवियों का AI की मशीन लर्निंग में उपयोग करने के कॉपीराइट कानून के मुद्दों के बारे में विवरण दिया है।
कॉपीराइट कानून के तहत कृतियों का मशीन लर्निंग में उपयोग करना मान्य है (जापानी कॉपीराइट कानून धारा 30 के 4)। हालांकि, अपवाद के रूप में, यदि कॉपीराइट धारक के हितों को अनुचित रूप से क्षति पहुंचाई जाती है या यदि पक्षों के बीच कॉपीराइट कानून की प्रावधानों से भिन्न सहमति होती है, तो कृतियों का उपयोग अनुमति नहीं हो सकती है।
‘Midjourney’, ‘Stable Diffusion’, ‘ChatGPT’ जैसी AI का ध्यान आकर्षित कर रही है और अधिक से अधिक कंपनियाँ AI के विकास में शामिल हो रही हैं। कृतियों का उपयोग मशीन लर्निंग के लिए अनिवार्य डेटा के रूप में किया जा सकता है या नहीं, यह निर्णय करना कठिन हो सकता है, इसलिए AI और मशीन लर्निंग का उपयोग करने वाले व्यापारों के लिए हम IT क्षेत्र में विशेषज्ञ वकील से परामर्श करने की सलाह देते हैं।
हमारे कार्यालय द्वारा उपाय की जानकारी
मोनोलिथ कानूनी कार्यालय एक ऐसा कानूनी कार्यालय है, जिसमें IT, विशेष रूप से इंटरनेट और कानून के दोनों पहलुओं पर समृद्ध अनुभव है।
AI व्यापार में कई कानूनी जोखिम होते हैं, और AI से संबंधित कानूनी मुद्दों में माहिर वकीलों का समर्थन अत्यावश्यक है। हमारे कार्यालय में, AI में माहिर वकीलों और इंजीनियरों आदि की टीम के साथ, ChatGPT सहित AI व्यापार के लिए, संविदा निर्माण, व्यापार मॉडल की वैधता की जांच, बौद्धिक संपदा की सुरक्षा, प्राइवेसी के प्रतिक्रिया आदि के लिए उच्च स्तरीय कानूनी सहायता प्रदान की जाती है। नीचे दिए गए लेख में विस्तार से विवरण दिया गया है।
मोनोलिथ कानूनी कार्यालय के विभाग: AI (ChatGPT आदि) कानूनी मामले[ja]
Category: IT