इन्टरनेटमा रहेका नकारात्मक लेखहरूको परीक्षण गर्ने विधिहरूको व्याख्या: प्रतिष्ठा क्षति नियन्त्रणको पूर्वाधार

जापानमा कम्पनीका अनियमितताहरू वा विवादास्पद घटनाहरू, गिरफ्तारी वा पूर्व अपराधहरू सम्बन्धित वेब पृष्ठहरूलाई पूर्ण रूपमा हटाउने क्रममा, पहिलो कदमको रूपमा, ‘ती सबै नकारात्मक पृष्ठहरू र पोस्टहरूलाई बिना कुनै चुक लिस्ट गर्नु’ आवश्यक छ। यो लिस्टिङ नगरी, समग्र भोल्युमलाई हेर्दै प्रतिष्ठानको जोखिम व्यवस्थापन अगाडि बढाउन सकिँदैन, र उदाहरणका लागि, अन्तरिम आदेश वा मुद्दाको न्यायिक प्रक्रियामा, जुन काम एक पटकमा सकिनुपर्ने थियो, त्यसलाई दोहोर्याउनु पर्ने आवश्यकता उत्पन्न हुन सक्छ किनकि केहि चुक भएको थियो।
तर, इन्टरनेटमा, कुनै तथ्य (जस्तै कम्पनीका अनियमितताहरू वा विवादास्पद घटनाहरू, गिरफ्तारी वा पूर्व अपराध) सम्बन्धित सबै वेब पृष्ठहरू र पोस्टहरूलाई लिस्ट गर्नु ‘सजिलो’ छैन। यो काम अत्यन्तै विशेषज्ञता माग्ने र ज्ञान बिना गर्न नसकिने काम हो।
मोनोलिथ लॉ फर्म एक यस्तो कानूनी कार्यालय हो जुन जापानी इन्टरनेट अनुसन्धानमा विशेषज्ञता राख्दछ, जसमा पूर्व IT इन्जिनियरहरू र नेट अनुसन्धानमा विशेषज्ञ स्टाफहरू छन्। नेट अनुसन्धान कसरी गर्नुपर्छ भन्ने विषयमा तल विवरण दिइएको छ।
Google खोज परिणामहरू र यसका सीमाहरू के हुन्?
इन्टरनेटमा अनुसन्धान गर्ने मूल उपकरण निस्सन्देह Google खोज नै हो। तर, Google मा तपाईंले खोज्न चाहेको कीवर्ड, उदाहरणका लागि यदि तपाईंको नामसँग सम्बन्धित गिरफ्तारीको लेख हटाउन चाहनुहुन्छ भने, ‘मेरो नाम गिरफ्तारी’ भन्ने कीवर्डलाई खोज्दा प्रदर्शित हुने खोज परिणामहरूमा तीन वटा अर्थमा सीमाहरू छन्।
गुगल खोजमा समावेश हुने वेब पृष्ठहरू
इन्टरनेटमा ‘असंख्य’ वेब पृष्ठहरू छन्। इन्टरनेटमा रहेका कुल वेब पृष्ठहरूको संख्या सिद्धान्त रूपमा मापन गर्न असम्भव छ, तर एक अनुमान अनुसार, हालको समयमा वेबसाइटहरूको संख्या करिब १.८ अर्ब रहेको बताइन्छ।
एक वेबसाइट भित्र धेरै वेब पृष्ठहरू हुन सक्छन्, त्यसैले वेब पृष्ठहरूको संख्या त्यसभन्दा पनि धेरै हुन्छ।
र गुगल खोज भन्नाले साधारण रूपमा,
- गुगलको बट (Googlebot)ले इन्टरनेटमा खोजी गर्दै जान्छ र चिनिएका वेब पृष्ठहरूबाट लिंकहरू पछ्याउँदै नयाँ वेब पृष्ठहरू पत्ता लगाउँछ,
- ती पृष्ठहरूको सामग्रीलाई बुझ्छ (इन्डेक्स दर्ता),
- अनि ती पृष्ठहरूमा समावेश गरिएका किवर्डहरूको आधारमा खोजी गर्दा, ती पृष्ठहरूलाई खोजी परिणाममा देखाउँछ।
भन्ने कुरा के हो भने, गुगल खोजमा देखिने वेब पृष्ठहरू ती हुन् जुन गुगलले माथि उल्लेखित प्रक्रियाबाट इन्डेक्स दर्ता गरेका छन्, र ‘सबै वेब पृष्ठहरू’ होइन। यसको अर्थ यो हो कि गुगल खोज प्रयोग गर्दा, ‘गुगलले अझै इन्डेक्स दर्ता नगरेका वेब पृष्ठहरू’ फेला पार्न सकिँदैन, र साथै, इन्टरनेटमा रहेका सबै वेब पृष्ठहरूलाई पूर्ण रूपमा खोज्ने कुनै पनि तरिका यस संसारमा अवस्थित छैन।
「समान」 वेब पृष्ठहरू खोज परिणामबाट हटाइन्छन्
यसैगरी, Googleले इन्डेक्स गरिएका वेब पृष्ठहरू मध्ये, खोज शब्दहरू समावेश गरिएका सबै वेब पृष्ठहरूलाई खोज परिणाममा प्रदर्शन गर्दैन। यो कुरा तपाईंले सामान्य Google खोज प्रयोग गर्दा ध्यान दिनुपर्ने हुन सक्छ। खोज परिणामको अन्तिम पृष्ठमा देखाइने ‘सबैभन्दा प्रासंगिक खोज परिणामहरू प्रदर्शन गर्नका लागि, माथिका केहि पृष्ठहरू समान भएकाले हटाइएका छन्।’ भन्ने सन्देश देख्न सकिन्छ।

उदाहरणका लागि,
- कुनै समाचार प्रमुख समाचार साइटबाट प्राथमिक वितरण गरिएको छ
- समाचार लेखहरू संकलन गर्ने सेवाहरूमा पुन: प्रकाशित गरिएको छ
- व्यक्तिगत साइटहरूमा पनि पुन: प्रकाशित गरिएको छ
यस्तो अवस्थामा, समान सामग्री भएका पृष्ठहरूले खोज परिणामलाई पूर्ण रूपमा भरिदिन्छ र प्रयोगकर्ताहरूका लागि प्रयोग गर्न कठिन हुन्छ, त्यसैले Googleले ‘समान’ पृष्ठहरू, यस मामलामा २ र ३ लाई खोज परिणामबाट स्वचालित रूपमा हटाउँछ।
यो ‘प्रतिष्ठा क्षति पृष्ठहरूलाई हटाउन चाहने’ अवस्थामा, यो विशेषता हमेशा ‘प्रयोगमा सजिलो’ भन्न सकिन्न। उदाहरणका लागि, उल्लेखित ‘कुनै समाचार’ तपाईंको अतीतको गिरफ्तारीको लेख हो भने,
खोज परिणाममा प्रदर्शित भएको ‘१. प्रमुख समाचार साइटको प्राथमिक वितरण लेख’ मात्र थियो, त्यस पृष्ठलाई हटाएपछि, १ हटाइएपछि, ‘२. समाचार लेखहरू संकलन गर्ने सेवामा पुन: प्रकाशित लेख’ Google खोज परिणाममा प्रदर्शित हुन थाल्यो
यो समस्याको समाधानका लागि, उल्लेखित प्रदर्शनमा ‘खोज परिणामहरू सबै प्रदर्शन गर्न, यहाँबाट पुन: खोज गर्नुहोस्’ भागमा क्लिक गर्नु पर्छ। तर यो विशेषता र कार्यक्षमता थाहा नभएमा, प्रतिष्ठा क्षति पृष्ठहरूलाई ‘छुटाउन’ सकिन्छ, भन्ने कुरा हो।
एउटै साइटभित्र देखिने लेखहरूको संख्यामा सीमा छ

थपमा, Googleले एउटै वेबसाइटबाट देखिने खोजी परिणाम पृष्ठहरूको संख्यामा एक सीमा तोकेको छ। यो विशेषता अलि जटिल छ तर सरल रूपमा भन्नुपर्दा, “एउटै साइटबाट देखिने पृष्ठहरूको अधिकतम संख्या दुई हो”।
यसको अर्थ के हो भने, उदाहरणका लागि, यदि Yahoo! 知恵袋मा कुनै कम्पनी वा व्यक्तिको नाम सम्बन्धित Q&A पाँचवटा छन् भने, Googleमा त्यो कम्पनी वा व्यक्तिको नाम खोज्दा देखिने खोजी परिणाममा Yahoo! 知恵袋का पृष्ठहरू अधिकतम दुई मात्र देखिन्छन्। यो बोर्डहरूमा पनि यही हुन्छ, जस्तै 5ちゃんねる थ्रेडहरूमा कुनै किवर्ड समावेश गरिएका पाँचवटा थ्रेडहरू भए पनि, Google खोजी परिणाममा अधिकतम दुई मात्र देखिन्छन्। यसैगरी, कुनै व्यक्तिका बारेमा
- गिरफ्तारीको लेख
- पुनः गिरफ्तारीको लेख
- दोषी ठहराइएको लेख
यस्ता तीन लेखहरू एउटै समाचार साइटमा रहेको अवस्थामा, Google खोजी परिणाममा कम्तीमा पनि एउटा (3-2=1) देखिने छैन।
जब कुनै किवर्ड खोजिन्छ र त्यसै साइट (जस्तै Yahoo! 知恵袋, विशेष बोर्ड, विशेष समाचार साइट आदि)भित्रका पृष्ठहरू खोजी परिणाममा धेरै देखिन्छन् भने, प्रयोगकर्तालाई असुविधा हुन सक्छ, त्यसैले Googleले यस्तो विशेषता राखेको हो।
तर, यो विशेषता पनि, “प्रतिष्ठा हानिका पृष्ठहरूलाई हटाउन चाहने” अवस्थामा, सधैं “प्रयोगमा सजिलो” भन्न सकिन्न।
उदाहरणका लागि, माथिको Yahoo! 知恵袋का नकारात्मक Q&Aहरूलाई अदालती प्रक्रियामा हटाउन चाहने अवस्थामा, Google खोजी परिणाम हेरेर “लक्षित दुई मात्र छन्” भनी निर्णय गरी प्रक्रिया अघि बढाउँदा, हटाउन सफल भएमा, बाँकी 5-2=3 मध्ये कुनै एउटा खोजी परिणाममा देखा पर्न सक्छ।
उन्नत Google खोजका लागि ‘खोज फार्मूला’
माथिका समस्याहरू मध्ये, विशेष गरी तेस्रो समस्या समाधान गर्नका लागि आवश्यक छ, Google को ‘खोज फार्मूला’ भन्ने सुविधा।
Google निश्चित रूपमा ‘इन्टरनेटमा सम्पूर्ण रूपमा, त्यस कीवर्ड समावेश गरिएको पृष्ठहरू खोज्ने’ भन्ने कार्य (ग्लोबल खोज) को लागि ‘प्रति साइट आधारभूत रूपमा २ पृष्ठ’ भन्ने सीमा तोकेको छ। तर, ‘कीवर्ड site:लक्षित साइटको URL’ भन्ने ‘खोज फार्मूला’ प्रयोग गर्दा,
- निर्दिष्ट लक्षित साइट भित्रका लेखहरू मात्र खोज्ने
- त्यस खोज परिणाममा, ‘प्रति साइट आधारभूत रूपमा २ पृष्ठ’ भन्ने सीमा छैन
भन्ने खोज गर्न सकिन्छ।

‘खोज फार्मूला’ वास्तवमा अझ जटिल छ र माथि उल्लेखित समस्याहरू बाहेक अन्य समस्याहरू समाधान गर्न प्रयोग गरिने खोज फार्मूलाहरू पनि छन्।
विशेष साइटका लागि विशेष खोजी उपकरणहरू
उदाहरणका लागि, Yahoo! 知恵袋मा आफ्नै विशेष खोजी कार्यक्षमता छ।

यो खोजी, ‘Googleले (अकस्मात) इन्डेक्स दर्ता गरेको वेब पेज’ होइन, ‘Yahoo! 知恵袋को डाटाबेसलाई प्रत्यक्ष Yahoo! 知恵袋को खोजी कार्यक्रमले खोजेको परिणाम’ हो, जसले पहिलोमा उल्लेख गरिएको, ‘Googleले अझै इन्डेक्स दर्ता गर्न बाँकी रहेका वेब पेजहरू पनि छन्’ भन्ने समस्याको समाधान गर्दछ। ‘Yahoo! 知恵袋को पृष्ठहरूमा, Yahoo! 知恵袋को खोजी कार्यक्षमता मात्र प्रयोग गरे पुग्छ, सबै कुरा छुट्टै फेला पार्न सकिन्छ’ भन्ने कुरा हो।
अर्थात्,
कुनै तथ्य (कम्पनीको दुर्घटना, व्यक्तिको गिरफ्तारी आदि)को बारेमा, कम्तिमा, ग्लोबल खोजमा Yahoo! 知恵袋को पृष्ठ फेला परेको अवस्थामा, ‘site:’ खोजी शैली प्रयोग गर्नुभन्दा Yahoo! 知恵袋को खोजी कार्यक्षमता प्रयोग गर्नाले छुटेका कुराहरू बिना सूचीकरण गर्न सकिन्छ।
यो कुरा Twitter आदिका लागि पनि उही हो। Twitterको सेवाको प्रकृतिअनुसार, चर्चामा आएका तथ्यहरू (कम्पनीको दुर्घटना, व्यक्तिको गिरफ्तारी आदि)का बारेमा ट्वीटहरू धेरै पटक अवस्थित हुन्छन्। यस्ता ट्वीटहरू सबै अवश्य पनि Googleमा इन्डेक्स दर्ता भएका हुँदैनन् र कम्तिमा, सबै ग्लोबल खोजमा देखिने हुँदैनन्।
जापानमा ‘1 केस’ को गणना विधि

उपयुक्त सूचीकरण र ‘URL’ को सम्बन्ध
यसअघि हामीले ‘Google खोजी आदि प्रयोग गरी जति सक्दो धेरै वेब पृष्ठहरू (URL) उठाउने तरिका’को बारेमा लेखेका छौं, तर धेरै सूचीकरण गर्न सकिन्छ भनेर मात्र पर्याप्त छैन। किनभने मेटाउने अनुरोधको लक्ष्य अवश्य पनि ‘URL’ लाई इकाईको रूपमा लिने छैन।
5चैनलको केसमा
यो विशेष गरी फोरम आधारित वेबसाइटहरू (5चैनल र यसका कपी साइटहरू वा अन्य फोरम साइटहरू) को केसमा समस्या बन्न सक्छ।
उदाहरणका लागि, कुनै किवर्डलाई Google मा ‘site:5ch.net’ को खोजी सूत्र प्रयोग गरेर खोज्दा, 5चैनल भित्रबाट खोज्दा, तलका जस्ता URLहरू खोजी परिणामको रूपमा देखाइन्छ:
- ○○○.5ch.net/test/read.cgi/○○/○○○○/40
- ○○○.5ch.net/test/read.cgi/○○/○○○○/1-100
- ○○○.5ch.net/test/read.cgi/○○/○○○○/30-
5चैनलमा,
- थ्रेडको URL पछि रेस्पोन्स नम्बर उल्लेख गर्दा, त्यस विशेष रेस्पोन्स मात्र देखाइन्छ
- थ्रेडको URL पछि ‘A-B’ जस्तो रेस्पोन्स नम्बरको दायरा उल्लेख गर्दा, त्यस विशेष दायराका रेस्पोन्स मात्र देखाइन्छ
- थ्रेडको URL पछि ‘A-‘ जस्तो रेस्पोन्स नम्बरको सुरुवात र ‘-‘ उल्लेख गर्दा, त्यस रेस्पोन्स पछिका रेस्पोन्सहरू मात्र देखाइन्छ
अर्थात्, रेस्पोन्स नम्बर 40 मा किवर्ड लेखिएको छ भने, विभिन्न URLहरू (वेब पृष्ठहरू) ‘खोजी परिणाम’मा देखाइन्छ।
तर, फोरम आधारित वेबसाइटहरूमा मेटाउने अनुरोध गर्दा, त्यस अनुरोधको लक्ष्यको इकाई कम्तिमा पनि सिद्धान्ततः ‘रेस्पोन्स’ हो। तसर्थ, रेस्पोन्स नम्बर 40 को रेस्पोन्स मेटाउन चाहनुहुन्छ भने, स्पष्ट रूपमा
- ○○○.5ch.net/test/read.cgi/○○/○○○○/40
भन्ने URL मात्र निकाल्नु पर्छ, अन्य दुईलाई सूचीमा राख्नु पर्दैन।
5चैनलका कपी साइट र सम्मेलन साइटको केसमा
अनि यदि थप्नु पर्दा, अझ जटिल कुरा यो हो कि, 5चैनल (सिरिज) का कपी साइट र ‘सम्मेलन साइट’को केसमा, साइटको आधारमा, मेटाउने अनुरोधको इकाई ‘रेस्पोन्स’ होइन, ‘पृष्ठ (थ्रेड)’ हुन सक्छ। ‘कुन साइटको मेटाउने अनुरोधको लक्ष्य के हो’ भन्ने पूर्ण रूपमा ‘नोउहाउ’को क्षेत्र हो।
https://monolith.law/reputation/delation-of-scraping-site-roundup-website[ja]
यसकारण,
- कानूनी मेटाउने अनुरोधको इकाईको बुझाइ
- कुनै वेबसाइटको URL विन्यास (उदाहरणका लागि 5चैनलमा उल्लेखित जटिल नियमहरू)को बुझाइ
बिना ‘खोजी परिणाम हेर्दै मेटाउने लक्ष्यलाई सूचीकरण गर्ने’ कुरा आफैंमा गाह्रो हुन्छ।
ओपन वेब बाहेकको खोजी

यसअघि हामीले Google ले इन्डेक्स गर्न सक्ने सम्भावना भएका साइटहरूको बारेमा चर्चा गरेका थियौं, तर
- Google ले निश्चित रूपमा इन्डेक्स नगर्ने
- तर फेम ड्यामेज म्यानेजमेन्टका लागि हटाउने अनुरोधको रूपमा विचार गर्नुपर्ने
साइटहरू पनि छन्।
Google ले माथिको विशेषताहरूका आधारमा, लगइन नगरी पनि कसैले हेर्न सक्ने वेबसाइटहरू (ओपन वेब) मात्रै खोजी गर्ने लक्ष्य राख्दछ। तर उदाहरणका लागि, यस संसारमा ‘पुराना समाचार लेखहरूको खोजी गरी हेर्न सकिने, शुल्क लाग्ने (त्यसैले प्रयोगकर्ता दर्ता वा लगइन बिना हेर्न नसकिने) वेब सेवा’ जस्ता कुराहरू पनि छन्।
उदाहरणका लागि, गिरफ्तारीका लेखहरू हटाउने क्रममा, माथिका समाचार डाटाबेस साइटहरूमा पनि छानबिन गर्नु आवश्यक छ। किनकि कम्पनीहरू र व्यक्तिहरूको क्रेडिट जाँच गर्ने कम्पनीहरूले धेरैजसो माथिका समाचार डाटाबेस साइटहरू प्रयोग गर्दछन्।
समाचार डाटाबेस साइटहरूको बारेमा तलको लेखमा विस्तृत रूपमा व्याख्या गरिएको छ।
https://monolith.law/reputation/criminal-record-newspaper-database[ja]
सारांश
यसरी, “इन्टरनेटमा ख्याति जोखिम व्यवस्थापनको रूपमा पृष्ठहरू हटाउनको लागि अनुरोध गर्ने लक्ष्यहरूको सूची बनाउने” कार्य अत्यन्तै विशेषज्ञता माग्ने काम हो। हाम्रो कानूनी कार्यालयले यस्ता ख्याति जोखिम व्यवस्थापन सेवाहरू प्रदान गर्दा उल्लिखित प्रकारका लेखहरूको सूची बनाउँछ, र यो काम IT र इन्टरनेट सम्बन्धी विशेषज्ञताको आधारमा गरिन्छ।

इन्टरनेटमा ख्याति जोखिम व्यवस्थापनमा, पृष्ठहरू (र मेसेज बोर्डहरूका प्रतिक्रियाहरू) हटाउने काम वकिलहरू मात्रले गर्न सक्ने काम हो।
https://monolith.law/reputation/hiben-koui[ja]
तर अर्कोतर्फ, यो सूचीकरण विशेष गरी IT र इन्टरनेट ज्ञानलाई, यस लेखमा वर्णन गरिएको अनुसार, अत्यन्तै उच्च स्तरमा माग गर्ने काम हो। यो ख्याति जोखिम व्यवस्थापनलाई IT र इन्टरनेट सम्बन्धी उच्च विशेषज्ञता भएको कानूनी कार्यालयमा निर्भर गर्नुपर्ने मुख्य कारणहरू मध्ये एक हो। दोहोर्याउँदा, यस्तो सूचीकरण अपर्याप्त हुँदा,
- सूचीकृत पृष्ठहरू सफा गरिए पनि, सूचीकरणको समयमा वैश्विक खोज परिणाममा देखिएन भने अन्य पृष्ठहरू खोज परिणाममा देखा पर्न सक्छन्, र थप हटाउनु पर्ने आवश्यकता उत्पन्न हुन्छ, जसले गर्दा प्रारम्भिक बजेट अनुमान ठूलो मात्रामा गलत हुन सक्छ
- अदालती प्रक्रियाहरूको सन्दर्भमा, मूलतः एक पटकमा सम्पन्न हुनुपर्ने काम दुई वा तीन पटक गर्न आवश्यक हुन सक्छ, र अत्यधिक खर्च आवश्यक पर्न सक्छ
- समाचार डाटाबेस साइटहरू जस्ता खुला वेब बाहेकका पृष्ठहरूको अस्तित्व थाहा नपाउँदा, उदाहरणका लागि ‘गिरफ्तारीको लेख खोजिँदा रोजगारीमा बाधा पर्ने’ जस्ता समस्याहरूको समाधान हुँदैन
यस्ता समस्याहरू उत्पन्न हुन सक्छन्।
Category: Internet