스크레이핑이란 무엇인가? 주목받는 편리한 데이터 수집 방법의 법적 과제를 설명
데이터 분석 및 AI 기술이 발전함에 따라 ‘데이터 수집’이 주목받고 있습니다. 이에 따라, ‘스크레이핑’을 통한 데이터 수집 방법이 주목받고 있습니다. 스크레이핑은 자사에 충분한 데이터가 없는 경우에도 쉽게 사용할 수 있는 점에서 편리합니다. 그러나, 사용 방법에 따라서는 불편을 주는 행위 또는 불법 행위가 될 수도 있습니다. 스크레이핑을 이용할 때는 스크레이핑에 관한 법적인 문제를 충분히 이해하고 있어야 합니다.
그래서, 이 글에서는 스크레이핑을 사용하려는 사업자를 대상으로 스크레이핑에 관한 법적 문제에 대해 설명하겠습니다.
스크레이핑이란?
스크레이핑이란, ‘문지르다’ 혹은 ‘긁어모으다’라는 뜻의 영어 단어 ‘Scraping’에서 유래한 컴퓨터 용어입니다. 특정 웹사이트나 프로그램 등에서 데이터나 정보를 추출, 획득, 수집하는 기술을 가리킵니다.
웹 스크레이핑, 웹 크롤러, 웹 스파이더 등으로도 불립니다.
최근에는 데이터나 정보의 가치가 높아지면서, 스크레이핑을 활용해 데이터나 정보의 추출, 획득, 수집을 하는 기업들이 늘어나고 있습니다.
구체적으로는, 먼저 스크레이핑을 통해 필요한 정보의 추출, 획득, 수집을 진행합니다.
그 다음, 수집한 데이터를 분석 등을 통해 스크레이핑의 목적에 맞게 데이터베이스를 구축합니다.
그 후, 데이터베이스를 고객에게 제공하거나, 또는 자사의 사업에 활용합니다.
스크레이핑이 법적으로 문제가 되는 경우
스크레이핑에 대해 항상 법적 문제가 발생하는 것은 아니며, 특정한 경우에 법적 문제가 발생하게 됩니다.
따라서, 아래에서는 법적 문제가 발생할 수 있는 경우를 소개하겠습니다.
스크레이핑을 금지하는 이용 약관에 위반하는 경우
특정 웹사이트를 이용할 때, 해당 웹사이트의 이용 약관에 동의한 경우, 이용자는 이용 약관에 따라서 이용해야 합니다.
이용 약관 중에 스크레이핑을 금지하는 조항이 포함되어 있는 경우, 당연히, 이용 약관에 동의한 사람은 이용 약관을 위반하여 스크레이핑을 할 수 없습니다.
이용 약관을 위반하여 스크레이핑을 하면, 채무 불이행이나 불법 행위가 되어, 웹사이트의 운영자로부터 손해배상 청구나 스크레이핑의 중지 등의 민사 책임을 물을 수 있습니다.
https://monolith.law/corporate/web-terms-of-service-part1[ja]
https://monolith.law/corporate/web-terms-of-service-part2[ja]
저작권법에 위반하는 경우
특정 웹사이트 상의 데이터나 콘텐츠에는 저작권이 인정되는 경우가 있으며, 저작권이 인정되는 경우에는 저작권법에 의한 보호를 받게 됩니다.
그러므로, 스크레이핑을 할 때는 저작권법을 위반하지 않도록 주의해야 합니다.
저작권이란
저작권이란, 창작물을 보호하기 위한 권리를 말합니다.
참고로, 창작물이란, 생각이나 감정을 창조적으로 표현한 것으로서, 문학, 학문, 미술 또는 음악의 범위에 속하는 것을 말합니다(저작권법 제2조 제1항 제1호).
스크레이핑을 하는 데이터나 콘텐츠에 저작권이 인정되지 않는 경우
특정 웹사이트 상의 데이터나 콘텐츠에 저작권이 인정되는 경우에는 저작권법에 의한 보호를 받게 되지만, 반면에 단순한 데이터 등에 불과하고, 저작권이 인정되지 않는 경우에는 저작권법에 의한 보호를 받지 않게 됩니다.
그러므로, 스크레이핑을 이용할 때는 어떤 내용의 데이터를 수집하는지 확인하고, 저작권이 인정되는지 여부를 검토해야 합니다.
스크레이핑을 하는 데이터나 콘텐츠에 저작권이 인정되는 경우
스크레이핑을 하는 데이터나 콘텐츠에 저작권이 인정되는 경우, 저작권법에 의해 보호를 받게 됩니다.
스크레이핑을 할 때, 데이터나 콘텐츠를 복사하는 작업이 포함되는 경우, 권리자의 동의를 얻지 않고 진행하면, 권리자의 복제권(저작권법 제21조) 등의 권리를 침해하게 될 수 있습니다.
하지만, 저작권법의 개정에 따라 추가된 저작권법 제30조의 4(창작물에 표현된 생각이나 감정의 즐길 목적이 아닌 이용)에 해당하는 경우에는 저작권의 침해가 되지 않습니다.
또한, 저작권법 제47조의 5(전자 계산기에 의한 정보 처리 및 그 결과의 제공에 따른 경미한 이용 등)에 해당하는 경우에도 저작권의 침해가 되지 않습니다.
서버에 과도한 접근이 발생하는 경우
스크레이핑을 하게 되면, 웹사이트에 과도한 접근이 발생하여 서버가 다운되고, 웹사이트의 열람이나 표시가 불가능해질 수 있습니다.
이 경우, 대상이 되는 웹사이트의 서버가 다운되면, 해당 웹사이트를 운영하는 기업 등은 업무를 수행할 수 없게 되므로, 사기적 업무 방해죄(형법 제233조)나 전자 계산기 손상 등 업무 방해(형법 제234조의 2)에 문제가 될 수 있습니다.
개인정보 보호법에 위반하는 경우
스크레이핑에 의해, 개인정보를 획득하는 경우가 있을 수 있습니다.
개인정보를 획득할 때는, 본인에게 이용 목적을 명확히 해야 합니다. 그러나, 특정한 사람에게 개별적으로 이용 목적을 명시하는 것은 현실적으로 불가능하다고 생각됩니다.
그러므로, 스크레이핑을 하여 개인정보를 획득하는 경우가 예상되는 경우에는, 개인정보 보호 정책 등을 공개하고, 이용 목적을 명확히 해야 합니다.
또한, 본인의 인종, 신조, 사회적 신분, 병력, 범죄 경력 등 특별히 주의를 요하는 개인정보(주의 필요 개인정보)에 대해서는 개인정보 보호 정책 등을 공개하는 것만으로는 획득할 수 없으며, 본인의 동의가 필요하므로 주의가 필요합니다.
또한, 스크레이핑에 의해 획득한 개인정보를 데이터베이스화하고, 제3자에게 제공하는 경우도 예상됩니다.
그러나, 제3자에게 제공하는 경우에는 원칙적으로 미리 본인의 동의를 얻어야 합니다(개인정보 보호법 제27조)이므로, 이 점도 주의가 필요합니다.
https://monolith.law/corporate/checkpoint-privacy-policy[ja]
스크레이핑이 실제로 문제가 된 사례
스크레이핑이 실제로 문제가 된 사례로는, 2010년 3월경에 발생한 ‘오카자키 시립 중앙 도서관 사건’이 있습니다.
이 사건은 오카자키 시립 중앙 도서관의 도서 검색 시스템에 접근 장애가 발생하였고, 이 접근 장애의 원인이 스크레이핑이었음이 나중에 밝혀졌습니다. 스크레이핑을 한 남성이 ‘가짜 업무 방해’ 혐의로 체포된 사건입니다.
체포된 남성은 오카자키 시립 중앙 도서관의 이용자였지만, 도서관의 도서 검색 시스템 사용에 불만이 있어, 도서 검색 시스템에 접근하여 데이터를 추출하는 행위를 하였습니다.
체포된 남성은 20일간 구류되었지만, 결국 오카자키 시립 중앙 도서관의 업무를 방해하는 강한 의도가 인정되지 않아 기소유예 처분이 되었습니다.
이 사건에서는 기소유예 처분이라는 비교적 가벼운 처분이 내려졌지만, 스크레이핑의 내용에 따라서는 무거운 처분이 내려질 가능성도 있으므로 주의가 필요합니다.
요약
지금까지, 스크레이핑을 활용하려는 사업자를 대상으로 스크레이핑에 관한 법적 문제에 대해 설명하였습니다.
스크레이핑에 대해서는, 활용 방식에 따라 법적 문제가 발생할 수도, 아닐 수도 있습니다. 따라서, 충분히 조사하지 않고 경솔하게 스크레이핑을 진행하면 법적 문제가 발생할 가능성이 있으므로 주의가 필요합니다.
스크레이핑에 법적 문제가 발생할지 여부를 판단하는데는 전문적인 지식이 필요하므로, 스크레이핑을 활용하려는 사업자분들은 전문적인 지식을 가진 변호사에게 상담하는 것을 권장드립니다.
본 사무소의 대책 안내
모노리스 법률 사무소는 IT, 특히 인터넷과 법률의 양면에 높은 전문성을 가진 법률 사무소입니다. 최근 주목받고 있는 스크레이핑의 활용에는 주의가 필요하며, 법적 검토의 필요성은 점점 증가하고 있습니다. 본 사무소는 다양한 법률 규제를 고려하여, 이미 시작한 비즈니스나 시작하려는 비즈니스에 대한 법적 위험을 분석하고, 가능한 한 비즈니스를 중단하지 않고 합법화를 도모합니다. 아래 기사에서 자세한 내용을 기술하고 있습니다.