특수검색

고객센터 메뉴

도움말

검색

질문
[검색원칙] Daum의 검색 원칙

답변

Daum의 검색 원칙


Daum 검색은 이용자가 원하는 정보를 보다 빠르고 정확하게 찾을 수 있도록 노력하고 있습니다. 이를 위해서 중립적인 자세로 데이터를 수집하고, 수집된 데이터는 적합하고 공정하게 노출될 수 있도록 관련 정책을 운영합니다. Daum 검색이 운영하고 있는 세부적인 검색 원칙은 아래와 같습니다.

1. 공정한 데이터의 수집 및 구축 원칙


아래는 Daum 검색이 이용자에게 정확하고 공정한 검색 결과를 제공함에 있어서 필요한 데이터 수집 정책의 원칙입니다.

가) Daum 검색은 인터넷상에 존재하는 가능한 모든 자료를 수집하거나 새롭게 구성한 결과물을 검색 서비스로 제공하기 위해서 노력하고 있습니다. 특히 국내 이용자들을 위한 한글 콘텐츠를 수집하고 서비스하는 것에 주력하고 있습니다. 이를 위해 Daum 검색은 크롤러(crawler)를 통해 인터넷상의 데이터를 수집하고 있습니다. 크롤러는 웹 상에 존재하는 웹페이지를 방문하며, 방문한 웹페이지의 운영자가 수집을 거부하는 정책을 가지고 있지 않는 한, 가능한 모든 정보를 수집합니다. 이 과정에서 임의로 특정 사이트를 수집 대상에서 배제하거나 차별을 두지 않습니다. 또한, 크롤러는 문서 내에 포함된 링크의 분석을 통해 문서 간의 연결관계를 파악해 새로운 문서를 자동으로 찾기도 합니다. 이를 통해 Daum 검색은 자동적으로 대량 데이터를 수집할 수 있고, Daum 검색 결과에서는 타사 콘텐츠나 SNS 데이터도 찾아보실 수 있습니다.

나) 실질적으로 인터넷의 한글 콘텐츠는 전 세계 콘텐츠 대비 그 수가 많지 않습니다. 때문에 Daum 검색은 양질의 콘텐츠를 구축하고 인터넷 생태계를 풍성하게 만들 수 있도록 카페, 블로그 등 서비스를 제공해 왔습니다. 이 서비스를 통해서 구축된 콘텐츠들은 단순히 개별 서비스로만 사용된 것이 아니라 훌륭한 검색 자료로 가치를 가지게 되었습니다. 이에 Daum 검색은 이용자들의 콘텐츠 중 검색을 허용하는 정보에 한해서 검색 결과로 제공하고 있습니다.

다) Daum 검색은 이용자가 원하는 정보를 제공함에 있어 불편함을 줄여주고, 검색 품질 향상을 위해 지속적으로 전문정보(DB)를 확보하기 위해 노력 중입니다. 음악, 영화, 부동산, 쇼핑 등의 서비스의 경우, 해당 콘텐츠를 제공하는 외부 회사와 계약 혹은 제휴를 통해 제공받고 있습니다. 이 데이터는 계약 및 제휴 내용에 근거해 저작권의 보호 하에 검색 콘텐츠로 사용하고 있습니다. 더불어 이러한 서비스가 ‘쇼핑하우’, 다음영화’, ‘다음부동산’, ‘멜론뮤직’ 등 계약 혹은 제휴를 통해 제공된다는 사실을 이용자가 쉽게 인지할 수 있도록 설명을 명시하고 있습니다.


2. 검색 결과 노출 원칙의 구성 요소 및 구성 방법


아래는 Daum 검색이 이용자에게 정확하고 공정한 검색 결과를 제공함에 있어서 필요한 노출 정책의 원칙입니다.

가) Daum 검색은 서비스를 제공함에 있어 "한국형 통합검색" 방식을 활용하고 있습니다. 이용자가 입력하는 ‘검색어’에 대해서 뉴스, 블로그, 카페, 이미지, 동영상, 인물, 영화, 음악 및 쇼핑 등 이른바 컬렉션(검색 대상과 결과를 통칭. 예를 들어 이미지를 대상으로 한 검색 결과는 "이미지 컬렉션"이나 "이미지 검색 컬렉션"으로 부름)이라 명명된 개별 검색 결과를 모아서 한 화면에 보여주는 방식을 말합니다. 이는 이용자가 어떤 의도를 가지고 검색하는지를 입력된 검색어 만으로는 판단이 어렵기 때문에 검색 결과를 풍부하게 보여주고자 하는 의도를 담고 있습니다. 예컨대 어떤 가수 이름을 검색하는 이용자가 해당 가수의 나이를 알고 싶은 것인지, 사진을 보고 싶은 것인지, 음악을 찾는 것인지 알 수 없기 때문입니다.


나) 검색 결과의 핵심은 그 결과가 이용자의 질문에 적합도가 높은 정보인지에 대한 여부입니다. 이 적합도를 구성하는 요소는 컬렉션이 가지는 고유의 특성에 따라서 조금씩 다를 수 있습니다만, 유사성, 문서품질, 최신성, 이용자의 반응 등이 있습니다. 아래는 구성 요소에 대한 간략한 정보입니다.


① 유사성: 검색 결과로 제시된 문서가 이용자가 입력한 검색어와 얼마나 유사한 내용을 포함하고 있는지 여부를 말합니다. 제목, 본문 등 문서의 중요한 영역에 검색어가 포함될 경우, 유사성이 높다고 할 수 있습니다.


② 문서품질: 내용이 부실한 문서의 제목에 이용자가 입력한 검색어가 있다고 해서, 이를 검색 결과물로 보여준다면 이용자의 불편만 가중될 수 있습니다. 따라서 문서자체의 기본 품질도 적합도의 중요 요소가 됩니다. 입력한 검색어와 상관없이 문서 자체가 얼마나 좋은지 여부와 문서를 구성하는 주제의 일관성 그리고 콘텐츠의 내용이 풍부할수록 상대적으로 품질이 높게 평가됩니다. 또한 예를 들어 블로그 문서의 경우 댓글이나 트랙백 등 다른 이용자들과 교류가 많은 문서, 조회수가 많은 문서들 즉, 인기가 많은 문서는 품질이 높게 평가됩니다. 더불어 문서 작성자가 평소 좋은 글을 많이 쓰는지 여부 등도 품질 판단 요소가 될 수 있습니다.


③ 최신성: 문서가 얼마나 최근에 작성되었는지 여부를 말합니다. 일반적으로 검색어를 입력한 시점과 검색 결과로 보일 문서의 작성 시점의 차이가 적게 날수록 관련성이 높다고 볼 수 있습니다. 또한, 최근에 작성된 문서는 그 문서가 담고 있는 내용이 유효할 가능성도 높습니다. 다만, 컬렉션의 종류에 따라 최신성을 고려하는 비중이 다를 수 있습니다. 뉴스처럼 새로운 정보에 대한 수요가 많은 경우와 사전처럼 고정된 정보를 주로 다루는 경우는 최신성을 고려하는 비중이 상반될 수 있습니다. 검색어 자체에서도 최신성을 고려하는 비중이 상이할 수 있는데, 고사성어 같은 검색어에 비해 스포츠 경기 결과를 찾는 검색어는 최신성 비중이 높은 것을 예로 들 수 있습니다.


④ 이용자 반응: 이용자가 다수의 검색 결과 중 원하는 정보를 이용하는 패턴은 적합도를 확인할 수 있는 중요한 요소입니다. 대표적으로, 어떠한 컬렉션 또는 개별 문서가 검색 결과 내에서 상위 노출되었음에도 불구하고 이용자가 해당 콘텐츠를 이용하지 않았다면 낮은 만족도 때문이었다고 추정할 수 있습니다. 반대로 이용자가 많이 이용하고 반응을 보이거나 오랜 시간 해당 콘텐츠에 머물렀던 것이 확인되거나, 해당 결과를 이용한 이후 다른 검색 결과를 이용하지 않았다면 그 문서 혹은 컬렉션에서 가장 높은 검색 만족도를 얻었다고 해석할 수도 있습니다. 이와 같이 Daum 검색은 이용자의 검색 결과 만족도에 도움이 되는 정보 및 요소들과 그 반대의 것들을 지속적으로 확인하고 있으며, 검색 결과 만족도를 떨어뜨리는 요소가 발견되면 추후 검색 결과를 제공할 때 반영하고 있습니다.


⑤ 적합도 방해요소: 위와 상반되는 검색의 적합도에 방해가 되는 요소들이 존재하며 아래와 같습니다.
- 성인 콘텐츠
- 마약, 도박 등의 불법 콘텐츠
- 영화, 음악, 서적 등의 저작권 침해 콘텐츠
- 주민등록번호 등 타인에 의해서 불법적으로 활용될 가능성이 있는 개인정보가 포함된 콘텐츠
- 의도적으로, 문서 클릭 시 해당 문서가 아닌 다른 문서로 이동시키거나 문서 내에 악성코드가 있는 콘텐츠
- 비정상적인 키워드, 이미지, 링크 처리 등을 통해서 만들어진 콘텐츠
- 특정 키워드를 대량으로 반복해서 작성하는 등의 방법으로 만들어진 콘텐츠


다) Daum 검색에서 생각하는 좋은 문서는 아래와 같습니다.


① 어떤 대상에 대한 생각이나 경험한 내용을 작성자가 본인이 직접 작성해 검색 이용자들에게 실제적 정보를 제공할 수 있는 문서
② 내용을 이해하는데 도움을 주는 사진, 동영상, 지도 등의 부가정보가 풍부한 문서
③ 비교적 최신의 신뢰할 수 있는 정보를 담고 있는 문서
④ 비슷한 내용의 많은 문서 보다 그 문서만의 고유한 정보가 있는 소수의 문서
⑤ 영리목적보다 웹 콘텐츠 생산을 위한 목적으로 작성된 문서


라) 이와 같이 적합도를 기준으로 선별된 적합한 문서들은 이용자가 검색어를 입력함으로써 확인할 수 있습니다. 검색은 이용자가 검색어를 입력하면, 검색엔진이 Daum 검색이 수집하거나 새롭게 구성한 결과물과 검색어 간의 적합도를 계산하고 그 확률이 높은 순서대로 보여줍니다. 하지만, 이 과정에서 Daum 검색이 자체적으로 서비스하는 정보를 우대해 타 서비스 정보보다 무조건 먼저 보여준다면, 검색 품질이 떨어질 수밖에 없습니다. 때문에, 검색 적합도를 최우선 목표로 하는 Daum 검색에서는 자사 서비스 외에 다른 서비스에 대해 차별하지 않습니다. Daum 검색은 Daum 문서와 외부로부터 수집 혹은 제공된 문서를 노출하는 방법에 있어, 이용자가 입력한 검색어와 적합할 확률이 높은 문서를 먼저 보여주는 정책을 가지고 있습니다.


마) 검색어에 따라 제시되는 컬렉션 및 컬렉션을 구성하는 문서의 종류와 숫자는 최적의 검색 결과를 위해 자동으로 결정되며 수정이 불가능합니다. 인위적으로 개입해 검색 결과를 조정할 경우, 오히려 이용자의 검색 만족도와 서비스의 경쟁력을 떨어뜨릴 수 있기 때문입니다.


바) Daum 검색은 검색 품질을 높이기 위해서 이용자의 검색 이용 정보를 활용하고 있습니다. 이를 반영해 적합도와 관련된 다양한 요소들의 가중치를 재구성하는 개선 작업을 꾸준히 수행하고 있습니다. 때문에 검색 결과는 검색 시점에 따라 다르게 나타날 수 있습니다.


사) Daum은 한국인터넷자율정책기구(KISO) 회원사로 Daum 검색의 관련검색어, 서제스트 등의 검색어 서비스 제공 방식과 운영은 KISO 정책규정을 준수하고 있습니다. 상세 내용은 검색어 도움말에서 확인하실 수 있습니다


Daum 검색은 서비스를 함에 있어서 항상 위 원칙을 준수하고 있으며, 이용자가 더 좋은 검색 결과를 확인 할 수 있도록 끊임없이 연구하고 있습니다. 이용자에게 도움이 될 수 있는 원칙의 유지, 보완 및 개선을 위해서 앞으로도 더욱더 노력하도록 하겠습니다.

현재글의 이전,다음글 보기