Giải thích phương pháp kiểm tra bài viết tiêu cực trên mạng là tiền đề cho biện pháp đối phó với thiệt hại do đánh giá xấu
Trong trường hợp muốn loại bỏ hoàn toàn các trang web liên quan đến các sự cố công ty trong quá khứ, các vụ bùng nổ, bắt giữ hoặc tiền án, điều đầu tiên cần làm là “liệt kê tất cả các trang web và bài đăng tiêu cực mà không bỏ sót”. Nếu không thể liệt kê, bạn sẽ không thể tiến hành các biện pháp phòng ngừa rủi ro về danh tiếng dựa trên tổng số lượng, và có nguy cơ phải thực hiện các thủ tục tại tòa án như các biện pháp tạm thời hoặc xét xử hai lần do bỏ sót, trong khi thực tế chỉ cần một lần.
Tuy nhiên, việc liệt kê tất cả các trang web và bài đăng mô tả một sự thật cụ thể (ví dụ như sự cố công ty, vụ bùng nổ, bắt giữ hoặc tiền án) trên Internet không phải là “đơn giản”. Công việc này đòi hỏi chuyên môn cao và không thể thực hiện nếu không có kiến thức chuyên môn.
Văn phòng luật sư Monolith, với đội ngũ bao gồm luật sư đại diện từng là kỹ sư IT và nhân viên chuyên nghiệp trong việc tìm kiếm trên mạng như đã nêu trên, là một văn phòng luật sư chuyên về các biện pháp phòng ngừa rủi ro về danh tiếng. Chúng tôi sẽ giải thích cách thực hiện tìm kiếm trên mạng như thế nào dưới đây.
Google tìm kiếm kết quả và giới hạn của nó là gì?
Cơ bản của việc nghiên cứu trên mạng, chắc chắn là tìm kiếm Google. Tuy nhiên, với Google, kết quả tìm kiếm hiển thị khi bạn tìm kiếm từ khóa mà bạn muốn tìm, ví dụ trong trường hợp xóa bài viết về việc bắt giữ, từ khóa như “Tên của tôi Bắt giữ”, có giới hạn trong 3 ý nghĩa.
Trang web được tìm kiếm bởi Google
Trên Internet, có “vô số” trang web tồn tại. Tổng số trang web trên Internet về lý thuyết không thể đo lường được, nhưng theo một số ý kiến, số “website” hiện tại đã đạt khoảng 1,8 tỷ.
Vì một website có thể chứa nhiều trang web, số lượng trang web sẽ nhiều hơn rất nhiều so với số lượng website.
Và tìm kiếm Google, nói một cách đơn giản, là:
- Bot của Google (Googlebot) quét Internet, phát hiện trang web mới có thể mở từ các liên kết trong các trang web đã biết
- Hiểu nội dung của trang đó (đăng ký chỉ mục)
- Khi tìm kiếm bằng từ khóa trong trang đó, hiển thị trang đó trong kết quả tìm kiếm
Điều này được thực hiện theo cơ chế như trên. Điều tôi muốn nói là, những gì được hiển thị trong tìm kiếm Google là “trang web mà Google đã đăng ký chỉ mục như đã nêu trên”, chứ không phải “tất cả các trang web”. Nói cách khác, miễn là bạn sử dụng tìm kiếm Google, bạn không thể tìm thấy “trang web mà Google chưa đăng ký chỉ mục”, và không có cách nào để tìm kiếm tất cả các trang web trên Internet mà không bỏ sót.
“Trang web ‘tương tự’ sẽ bị loại khỏi kết quả tìm kiếm”
Google không hiển thị “tất cả các trang web chứa từ khóa tìm kiếm” trong kết quả tìm kiếm từ số lượng trang web đã đăng ký trong chỉ mục. Điều này có thể bạn sẽ nhận ra khi sử dụng tìm kiếm Google bình thường. Đó là thông báo hiển thị ở trang cuối cùng của kết quả tìm kiếm, “Để hiển thị kết quả tìm kiếm chính xác nhất, các trang tương tự với ○ trên đã bị loại bỏ”.
Ví dụ,
- Một tin tức được phát hành lần đầu tiên trên trang web tin tức lớn
- Tin tức được tái xuất bản trên các dịch vụ tổng hợp tin tức
- Tin tức cũng được tái xuất bản trên các trang web cá nhân, v.v.
Trong trường hợp như vậy, nếu các trang có nội dung giống nhau chiếm đầy kết quả tìm kiếm, điều này sẽ khó sử dụng đối với người dùng, vì vậy Google tự động loại bỏ các trang “tương tự”, trong trường hợp trên là 2 và 3, khỏi kết quả tìm kiếm.
Điều này không phải lúc nào cũng là một tính năng “dễ sử dụng” khi bạn muốn “loại bỏ tất cả các trang phỉ báng”. Ví dụ, nếu “tin tức” ở trên là bài báo về việc bạn bị bắt trong quá khứ,
Chỉ có “1. Bài báo phát hành lần đầu tiên trên trang web tin tức lớn” được hiển thị trong kết quả tìm kiếm, vì vậy khi bạn chỉ xóa trang đó, do 1 đã bị xóa, “2. Bài báo tái xuất bản trên dịch vụ tổng hợp tin tức” sẽ xuất hiện trong kết quả tìm kiếm Google.
Đây là một tình huống có thể xảy ra.
Vấn đề này có thể được giải quyết bằng cách nhấp vào phần “Để hiển thị tất cả kết quả tìm kiếm, hãy tìm kiếm lại từ đây” trong thông báo trên, nhưng nếu bạn không biết về tính năng và cách sử dụng này, có khả năng bạn sẽ “bỏ sót” các trang phỉ báng.
Có giới hạn cho số lượng bài viết được hiển thị từ cùng một trang web
Hơn nữa, Google đã đặt một giới hạn cho số lượng trang kết quả tìm kiếm được hiển thị từ một trang web. Điều này hơi phức tạp, nhưng nói một cách đơn giản, “số lượng tối đa các trang được hiển thị từ cùng một trang web là 2”.
Điều này có nghĩa là, ví dụ, giả sử có 5 câu hỏi và trả lời trên Yahoo! Chiebukuro (một dịch vụ Q&A của Yahoo! Nhật Bản) mà tên của một công ty hoặc cá nhân xuất hiện, thì trong kết quả tìm kiếm của Google cho tên công ty hoặc cá nhân đó, chỉ tối đa 2 trang từ Yahoo! Chiebukuro sẽ được hiển thị. Điều này cũng áp dụng cho các diễn đàn, nếu có 5 chủ đề trên 5ch (một diễn đàn Nhật Bản) mà chứa một từ khóa, thì chỉ tối đa 2 chủ đề sẽ được hiển thị trong kết quả tìm kiếm của Google. Hơn nữa, ví dụ, nếu một người có:
- Bài viết về việc bị bắt
- Bài viết về việc bị bắt lại
- Bài viết về việc nhận án phạt
Và 3 bài viết này đều tồn tại trên cùng một trang tin tức, thì ít nhất một trong số chúng (3-2=1) sẽ không được hiển thị trong kết quả tìm kiếm của Google.
Khi tìm kiếm một từ khóa, nếu có quá nhiều trang từ cùng một trang web (ví dụ: Yahoo! Chiebukuro, một diễn đàn cụ thể, một trang tin tức cụ thể, v.v.) xuất hiện trong kết quả tìm kiếm, điều này sẽ gây phiền toái cho người dùng, vì vậy Google đã thiết lập quy định này.
Tuy nhiên, quy định này không phải lúc nào cũng “tiện lợi” khi bạn muốn “loại bỏ tất cả các trang có hại cho danh tiếng”.
Ví dụ, nếu bạn muốn xóa các câu hỏi và trả lời tiêu cực trên Yahoo! Chiebukuro thông qua quy trình tòa án, và bạn nhìn vào kết quả tìm kiếm của Google và quyết định rằng “chỉ có 2 mục cần xử lý”, thì khi bạn thành công trong việc xóa, một trong số 3 mục còn lại (5-2=3) sẽ xuất hiện trong kết quả tìm kiếm.
Tìm kiếm Google nâng cao sử dụng “Công thức tìm kiếm”
Trong số các vấn đề đã nêu trên, “Công thức tìm kiếm” của Google là tính năng cần thiết để giải quyết vấn đề thứ ba.
Google thực sự đã đặt giới hạn là “2 trang cơ bản cho mỗi trang web” cho chức năng “Tìm kiếm trang chứa từ khóa từ toàn bộ Internet” (Tìm kiếm toàn cầu). Tuy nhiên, khi sử dụng “Công thức tìm kiếm” là “từ khóa site: URL của trang web đích”, bạn có thể:
- Chỉ tìm kiếm trong các bài viết trên trang web đã chỉ định
- Không có giới hạn “2 trang cơ bản cho mỗi trang web” trong kết quả tìm kiếm của bạn
Bạn có thể thực hiện tìm kiếm như vậy.
“Công thức tìm kiếm” thực sự phức tạp hơn nhiều, và còn có các công thức tìm kiếm khác được sử dụng để giải quyết các vấn đề khác ngoài những vấn đề đã nêu trên.
Phương pháp tìm kiếm đặc biệt dành cho các trang web cụ thể
Ví dụ, trang web Yahoo! Chiebukuro (Yahoo! Answers) có một chức năng tìm kiếm độc đáo.
Chức năng tìm kiếm này không phải là “trang web mà Google đã đăng ký chỉ mục (ngẫu nhiên)” mà là “kết quả tìm kiếm từ cơ sở dữ liệu trong Yahoo! Chiebukuro bởi chương trình tìm kiếm của Yahoo! Chiebukuro”. Điều này giải quyết vấn đề mà tôi đã đề cập ở đầu, rằng “có những trang web mà Google chưa đăng ký chỉ mục”. Nói cách khác, “nếu là trang trong Yahoo! Chiebukuro, chỉ cần sử dụng chức năng tìm kiếm của Yahoo! Chiebukuro, bạn có thể tìm thấy tất cả mà không bỏ sót”.
Điều này có nghĩa là,
Về một sự thật cụ thể (như scandal của công ty, việc bắt giữ cá nhân, v.v.), ít nhất, nếu trang của Yahoo! Chiebukuro được tìm thấy trong tìm kiếm toàn cầu, việc sử dụng chức năng tìm kiếm trong Yahoo! Chiebukuro sẽ cho phép bạn liệt kê một cách đầy đủ hơn so với việc sử dụng công thức tìm kiếm “site:”.
Đó là điều mà tôi muốn nói.
Điều này cũng đúng với Twitter. Do tính chất của dịch vụ, Twitter là một trang web có nhiều tweet về sự kiện nổi bật (như scandal của công ty, việc bắt giữ cá nhân, v.v.). Không phải tất cả các tweet đều được Google đăng ký chỉ mục và không phải tất cả đều được hiển thị trong tìm kiếm toàn cầu.
Cách đếm “1 mục” cần xóa
Mối quan hệ giữa việc liệt kê đúng và “URL”
Đến giờ, chúng tôi đã viết về “cách tìm thấy nhiều trang web (URL) nhất có thể bằng cách sử dụng Google Search, v.v.”, nhưng điều đó không có nghĩa là càng liệt kê nhiều càng tốt. Đối tượng của yêu cầu xóa không nhất thiết phải là “URL”.
Trường hợp của 5ch.net
Điều này đặc biệt là vấn đề khi đề cập đến các trang web diễn đàn (như 5ch.net và các trang sao chép của nó, và các trang web diễn đàn khác).
Ví dụ, khi tìm kiếm một từ khóa trên Google với cú pháp tìm kiếm “site:5ch.net”, tức là, tìm kiếm trong 5ch.net, có trường hợp các URL sau đây được hiển thị như kết quả tìm kiếm.
- ○○○.5ch.net/test/read.cgi/○○/○○○○/40
- ○○○.5ch.net/test/read.cgi/○○/○○○○/1-100
- ○○○.5ch.net/test/read.cgi/○○/○○○○/30-
5ch.net có các quy định như sau:
- Nếu bạn ghi số phản hồi sau URL của chủ đề, chỉ phản hồi đó sẽ được hiển thị
- Nếu bạn ghi phạm vi số phản hồi dưới dạng “A-B” sau URL của chủ đề, chỉ các phản hồi trong phạm vi đó sẽ được hiển thị
- Nếu bạn ghi số phản hồi bắt đầu và “-” sau URL của chủ đề, chỉ các phản hồi từ phản hồi đó trở đi sẽ được hiển thị
Nói cách khác, chỉ cần từ khóa được viết trong phản hồi số 40, nhiều URL (trang web) khác nhau sẽ được hiển thị trong “kết quả tìm kiếm”.
Tuy nhiên, khi yêu cầu xóa từ một trang web diễn đàn, đơn vị của đối tượng yêu cầu, ít nhất là nguyên tắc, là “phản hồi”. Do đó, nếu bạn muốn xóa phản hồi số 40, bạn chỉ cần trích xuất URL sau:
- ○○○.5ch.net/test/read.cgi/○○/○○○○/40
Và bạn không cần liệt kê hai URL sau.
Trường hợp của các trang sao chép 5ch.net và các trang tổng hợp
Và để nói thêm, mặc dù đây là một câu chuyện khá phức tạp, ngay cả với 5ch.net (và các trang tương tự), trong trường hợp các trang sao chép hoặc “trang tổng hợp”, tùy thuộc vào trang web, đơn vị của yêu cầu xóa không phải là “phản hồi” mà là “trang (chủ đề)”. “Đối tượng yêu cầu xóa của trang web nào là gì” hoàn toàn thuộc về lĩnh vực “biết cách”.
https://monolith.law/reputation/delation-of-scraping-site-roundup-website[ja]
Vì vậy,
- Hiểu về đơn vị của yêu cầu xóa hợp pháp
- Hiểu về quy định URL của một trang web (ví dụ, 5ch.net có các quy định phức tạp như đã nêu trên)
Nếu không có, việc “liệt kê các đối tượng cần xóa trong khi xem kết quả tìm kiếm” sẽ trở nên khó khăn.
Tìm kiếm ngoài Web mở
Đến đây, chúng tôi đã giải thích về các trang web mà Google có thể đăng ký chỉ mục, nhưng
- Google chắc chắn không đăng ký chỉ mục
- Tuy nhiên, nên xem xét làm đối tượng yêu cầu xóa trong việc quản lý rủi ro về danh tiếng
cũng tồn tại nhóm trang web như vậy.
Google, theo các thông số kỹ thuật trên, chỉ tìm kiếm các trang web mà bất kỳ ai cũng có thể xem mà không cần đăng nhập (Web mở). Tuy nhiên, ví dụ, trên thế giới này, cũng tồn tại những dịch vụ web trả phí mà bạn có thể tìm kiếm và xem toàn bộ các bài báo cũ từ các tờ báo (do đó, bạn không thể xem nếu không đăng ký hoặc đăng nhập).
Ví dụ, trong trường hợp xóa bài báo về việc bắt giữ, cũng cần kiểm tra kỹ lưỡng trang web cơ sở dữ liệu báo chí trên. Đó là bởi vì nhiều công ty điều tra tín dụng của doanh nghiệp và cá nhân thường sử dụng trang web cơ sở dữ liệu báo chí trên.
Chúng tôi đã giải thích chi tiết về trang web cơ sở dữ liệu báo chí trong bài viết dưới đây.
https://monolith.law/reputation/criminal-record-newspaper-database[ja]
Tóm tắt
Như đã nêu trên, việc “liệt kê danh sách các đối tượng yêu cầu xóa từ Internet như một biện pháp đối phó với thiệt hại do tin đồn” là một công việc đòi hỏi chuyên môn cao. Văn phòng luật sư của chúng tôi thực hiện việc liệt kê danh sách các bài viết đối tượng như trên khi nhận biện pháp đối phó với thiệt hại do tin đồn, nhưng công việc này yêu cầu chuyên môn về IT và Internet.
Trong việc đối phó với thiệt hại do tin đồn trên Internet, việc xóa trang (hoặc bài đăng trên diễn đàn) là công việc mà chỉ luật sư mới có thể thực hiện.
Tuy nhiên, mặt khác, việc liệt kê danh sách này, chủ yếu yêu cầu kiến thức về IT và Internet, là một công việc đòi hỏi chuyên môn cao như đã giải thích trong bài viết này. Điều này là một trong những lý do lớn nên giao việc đối phó với thiệt hại do tin đồn cho văn phòng luật sư có chuyên môn cao về IT và Internet. Dù có lặp lại, nhưng nếu việc liệt kê danh sách này không được thực hiện đúng cách, sẽ xảy ra các vấn đề như:
- Ngay cả khi bạn đã xóa hết các trang được liệt kê, các trang khác không hiển thị trong kết quả tìm kiếm toàn cầu khi liệt kê sẽ xuất hiện trong kết quả tìm kiếm, yêu cầu xóa thêm, làm cho ngân sách ban đầu được tính toán sai lệch nghiêm trọng
- Về thủ tục tại tòa án, dù chỉ cần một lần, nhưng lại cần hai, ba lần, dẫn đến chi phí quá mức
- Không nhận ra sự tồn tại của các trang ngoài web mở như các trang cơ sở dữ liệu báo chí, ví dụ, không giải quyết “vấn đề” như “khó khăn trong việc tìm việc do bài viết về việc bắt giữ được tìm kiếm”
Đó là lý do các vấn đề như trên có thể xảy ra.
Category: Internet