阐述网络上负面文章的审查方法:风评损害对策的前提
在清除涉及过去公司丑闻、网络热点事件、逮捕或前科等相关的网页信息时,首先需要做的是“将所有这些负面网页和帖子列出来,确保没有遗漏”。如果不能列出这些信息,就无法在查看整体情况的同时进行声誉风险管理,例如,对于本应一次就能解决的临时处理或法庭程序,由于遗漏而需要进行两次,这样的风险也存在。
然而,从互联网上列出所有涉及某一事实(例如公司丑闻、网络热点事件、逮捕或前科)的网页和帖子,并不是一件“简单”的事。这部分工作需要高度的专业性,如果没有相关的专业知识,是无法完成的。
Monolith法律事务所是一家具有声誉风险管理专业性的法律事务所,拥有前IT工程师作为首席律师和专门进行上述网络研究的员工。下面,我们将解释网络研究应该如何进行。
Google搜索结果及其限制是什么?
网络研究的基础无疑是Google搜索。然而,使用Google搜索自己想要找的关键词,例如在删除逮捕文章的情况下搜索“自己的姓名 逮捕”这样的关键词,显示的搜索结果在三个方面存在限制。
成为Google搜索对象的网页
在互联网上,存在着“无数”的网页。虽然互联网上的总网页数在理论上是无法测量的,但据一种说法,目前“网站”的数量约为18亿。
由于一个网站内部存在多个网页,因此网页的数量远远超过这个数字。
简单来说,Google搜索是这样进行的:
- Google的机器人(Googlebot)在互联网上进行搜索,通过跟踪已知网页中的链接,发现可以打开的新网页
- 理解该页面的内容(索引注册)
- 当该页面包含的关键词被搜索时,将该页面显示在搜索结果中
也就是说,Google搜索显示的是“Google通过上述方式进行索引注册的网页”,而不是“所有的网页”。也就是说,只要使用Google搜索,就无法找到“Google尚未进行索引注册的网页”,更不用说,世界上不存在一种方法可以完全无遗漏地搜索互联网上的所有网页。
「相似」的网页将被从搜索结果中排除
Google并不会将「所有包含搜索关键词的已索引网页」都显示在搜索结果中。这可能是你在正常使用Google搜索时会注意到的情况。在搜索结果的最后一页,会显示「为了显示最准确的搜索结果,已排除了与上述○项相似的页面。」。
例如,
- 某条新闻首次在大型新闻网站上发布
- 新闻文章被转载到新闻汇总服务等
- 也被转载到个人网站等
在这种情况下,如果同样的内容的页面充斥着搜索结果,对用户来说使用起来会很不方便,因此,Google会自动从搜索结果中排除「相似」的页面,如上述情况的2和3。
然而,这并不一定是「易用」的规定,特别是在「想要清除负面评价页面」的情况下。例如,如果上述的「某条新闻」是关于自己过去的逮捕报道,
如果搜索结果中只显示了「1.大型新闻网站的首次发布文章」,那么只删除该页面,由于1的消失,接下来「2.新闻汇总服务上的转载文章」可能会出现在Google搜索结果中
这种情况是可能发生的。
对于这个问题,虽然可以通过点击上述显示中的「要显示所有搜索结果,请从这里重新搜索」部分来解决,但如果不知道这个规定或功能,就有可能「错过」负面评价页面。
同一网站内显示的文章数量有上限
此外,Google对一个网站内显示的搜索结果页面数量设定了上限。这个规定有些复杂,但简单来说,同一网站内显示的最大页面数是“2页”。
这是什么意思呢?例如,假设在Yahoo!知识+中,有5个提到某公司或个人名字的问答,但在Google搜索该公司或个人名字的结果中,Yahoo!知识+的页面最多只会显示2页。论坛等也是如此,即使有5个包含某关键词的5ch(日本的一个网络论坛)主题,Google搜索结果中最多只会显示2个。又比如,如果某人有以下三篇文章:
- 被逮捕的文章
- 被再次逮捕的文章
- 被判有罪的文章
如果这三篇文章都存在于同一新闻网站上,那么在Google搜索结果中,至少有一篇(3-2=1)不会显示。
当搜索某个关键词时,如果同一网站(例如Yahoo!知识+,特定的论坛,特定的新闻网站等)的页面在搜索结果中大量出现,对用户来说会很不方便,因此Google采取了这样的规定。
然而,这个规定对于“想要清除负面评价页面”的情况来说,并不一定“好用”。
例如,如果你想通过法院程序删除Yahoo!知识+中的负面问答,看到Google搜索结果中“只有2个目标”就判断并开始程序,那么在成功删除后,剩下的3个(5-2=3)中的某个可能会出现在搜索结果中。
使用「搜索表达式」进行高级Google搜索
在上述问题中,特别是为了解决第三个问题,我们需要使用Google的「搜索表达式」功能。
Google确实对「从互联网全球范围内搜索包含特定关键词的页面」这个功能(全球搜索)设定了「每个网站基本上限为2页」的限制。但是,如果使用「关键词 site:目标网站的URL」这样的「搜索表达式」,
- 只针对指定的目标网站内的文章进行搜索
- 这种搜索结果没有「每个网站基本上限为2页」的限制
就可以进行这样的搜索。
「搜索表达式」实际上更复杂,还存在用于解决上述其他问题的搜索表达式。
特定网站的特殊搜索手段
例如,Yahoo!知识+(Yahoo!知恵袋)具有独特的搜索功能。
这种搜索不是“Google偶然索引的网页”,而是“直接由Yahoo!知识+的搜索程序搜索Yahoo!知识+数据库的结果”。因此,这解决了我们最初提到的“Google尚未索引的网页也存在”的问题。这意味着,“只要使用Yahoo!知识+的搜索功能,就可以找到Yahoo!知识+页面上的所有内容,而不会遗漏任何信息。”
也就是说,
关于某个事实(公司的丑闻,个人的逮捕等),至少在全球搜索中发现了Yahoo!知识+的页面,使用Yahoo!知识+的搜索功能比使用“site:”的搜索表达式能更全面地列出信息。
这就是我们要说的。
这同样适用于Twitter等。由于Twitter的服务性质,关于热门话题(公司的丑闻,个人的逮捕等)的推文往往有很多。这些推文并不一定都被Google索引,至少并不是所有的推文都会显示在全球搜索结果中。
「1件」删除目标的计数方法
适当的列表和「URL」的关系
到目前为止,我们已经讨论了「使用Google搜索等工具,尽可能多地获取网页(URL)的方法」,但是,能列出更多并不一定就是好事。因为删除请求的目标并不一定以「URL」为单位。
5ch(5ちゃんねる)的情况
这是一个特别在论坛类网站(如5ch或其复制网站等,以及其他论坛类网站)中会出现的问题。
例如,如果在Google中使用「site:5ch.net」的搜索表达式,也就是在5ch内部进行搜索,那么可能会出现以下这样的URL作为搜索结果。
- ○○○.5ch.net/test/read.cgi/○○/○○○○/40
- ○○○.5ch.net/test/read.cgi/○○/○○○○/1-100
- ○○○.5ch.net/test/read.cgi/○○/○○○○/30-
5ch的特点是:
- 在线程URL后面添加回复编号,只显示该回复
- 在线程URL后面添加「A-B」这样的回复编号范围,只显示该范围内的回复
- 在线程URL后面添加「A-」这样的回复编号起点和「-」,显示该回复之后的所有回复
也就是说,只要在回复编号40的回复中写入了相关关键词,就会有各种URL(的网页)在「搜索结果」中显示出来。
然而,对于论坛类网站的删除请求,其请求目标的单位至少原则上是「回复」。因此,如果你想删除回复编号40的回复,简单地说,只需要提取:
- ○○○.5ch.net/test/read.cgi/○○/○○○○/40
这样的URL就可以了,后两者不需要列出。
5ch复制网站和汇总网站的情况
再者,更复杂的是,即使是同样的5ch(系列),在其复制网站和「汇总网站」的情况下,根据网站的不同,删除请求的单位可能不是「回复」而是「页面(线程)」。「哪个网站的删除请求目标是什么」完全属于「专业知识」的范畴。
https://monolith-law.jp/reputation/delation-of-scraping-site-roundup-website[ja]
因此,如果没有:
- 对法律删除请求单位的理解
- 对某个网站的URL规范(例如5ch有上述复杂的规则)的理解
那么,「在查看搜索结果的同时列出删除目标」这件事本身就会变得困难。
开放网络以外的搜索
到目前为止,我们已经介绍了Google可能会进行索引注册的网站,但是,
- Google肯定不会进行索引注册
- 但是作为声誉风险管理,应考虑作为删除请求的对象
这样的网站群也存在。
Google在上述规定中,只将任何人都可以查看的网站(开放网络)作为搜索对象。但是,例如,这个世界上也存在“可以一次性搜索并查看新闻文章的过去文章的付费(因此,如果不进行用户注册或登录,就无法查看)网络服务”等。
例如,在删除逮捕文章的情况下,也需要对上述的新闻数据库网站进行详细的审查。因为调查公司或个人信用等的公司,往往会使用上述的新闻数据库网站。
关于新闻数据库网站的详细解释,请参阅下面的文章。
https://monolith-law.jp/reputation/criminal-record-newspaper-database[ja]
总结
如上所述,”在互联网上列出并请求删除可能造成名誉损害的内容”是一项需要高度专业性的工作。我们的律师事务所在接受名誉损害管理的任务时,会进行上述的目标文章列表整理工作,这项工作前提是需要具备IT和互联网的专业知识。
在互联网上进行名誉损害管理,删除页面(或论坛回复)的工作只能由律师来完成。
https://monolith-law.jp/reputation/hiben-koui[ja]
然而,另一方面,这种列表的整理工作,如本文所述,需要非常高级的IT和互联网知识。这是一个重要的原因,说明应该委托具有高度IT和互联网专业性的律师事务所来进行名誉损害管理。虽然这是重复的,但如果这种列表的整理工作不够严谨,可能会出现以下问题:
- 即使清理了所有列出的页面,也可能会出现在列表整理时未显示在全球搜索结果中的其他页面,需要进行额外的删除,从而导致最初的预算计算大大出错。
- 对于法院程序,本应一次就能解决的,却需要进行两次、三次,从而导致过高的费用。
- 没有注意到新闻数据库网站等开放网页以外的页面的存在,例如,”因为被搜索到逮捕文章,影响了就业”这样的”问题”没有得到解决。
这就是可能出现的问题。
Category: Internet