다음 검색원칙

1개 도움말

정렬 방식
[다음 검색원칙] 다음의 검색 원칙
다음의 검색 원칙

다음의 검색서비스는 인터넷 네트워크 상에 존재하는 수 많은 자료를 이용자가 원할 때정확하고 빠르게 찾을 수 있도록 노력하고 있습니다. 이를 위하여 다음은 수 많은 자료들 중에 이용자들이 원하는 결과를 보여주기 위해서는 데이터를 공정하게 수집을 해야 하고수집된 데이터는 적합하게 노출 될 수 있도록 정책을 운영해야 합니다이 일련의 과정은 다음 서비스 운영자의 판단이 아니라다수의 이용자 피드백을 바탕으로 하는 집단지성의 힘을 활용하고 있습니다.


아래는 다음이 이용자에게 위에서 언급한 정확하고 공정한 검색 결과를 제공함에 있어서 필요한 데이터 수집과 노출 정책의 원칙입니다.


    1. 공정한 데이터의 수집 및 구축 원칙


가)   다음 검색은 인터넷상에 존재하는 가능한 모든 자료를 수집하거나 새롭게 구성한 결과물을 검색 서비스로 제공하기 위해서 노력하고 있습니다특히 국내 이용자들을 위한 한글 콘텐츠를 수집하고 서비스하는 것에 주력하고 있습니다.
이를 위해 다음 검색은 크롤러(crawler)라 명명된 검색로봇을 통해 인터넷상의 데이터를 수집하고 있습니다검색로봇은 웹 상에 존재하는 웹 페이지를 방문하며방문한 페이지의 운영자가 다음 검색로봇의 수집을 거부하는 정책을 가지고 있지 않는 한가능한 모든 정보를 수집합니다이 과정에서 다음의 검색로봇은 임의적으로 특정 사이트를 수집의 대상에서 배제하거나 차별을 두지 않습니다.
또한검색로봇은 문서 내에 포함된 링크의 분석을 통해 문서간의 연결관계를 파악하여 새로운 문서를 자동으로 찾기도 합니다이를 통해서 다음은 자동적으로 대량의 데이터를 수집 할 수 있습니다이로서 다음 검색결과에서는 경쟁사의 블로그나 SNS데이터도 쉽게 찾아보실 수 있습니다.


나)    실질적으로 인터넷의 한글 콘텐츠는 전세계 콘텐츠 0.3%에 불과합니다때문에 다음은 양질의 콘텐츠를 구축하고 인터넷 생태계를 풍성하게 만들 수 있도록 위해 카페블로그지식 등 서비스를 제공해왔습니다이 서비스를 통해서 구축된 콘텐츠들은 단순히 개별 서비스로만 사용된 것이 아니라 훌륭한 검색 자료로서의 가치를 가지게 되었습니다. 이에 다음은 이용자들의 콘텐츠 중에서 검색을 허용하는 정보에 한해서 검색 결과로 제시하고 있습니다.


다)    다음은 이용자가 원하는 정보를 제공함에 있어 불편함을 줄여주고검색 품질 향상을 위해 지속적으로 전문정보(DB)를 확보하기 위해 노력 중입니다음악영화부동산쇼핑 등의 서비스의 경우해당 콘텐츠를 제공하는 외부 회사와 계약 혹은 제휴를 통하여 제공받고 있습니다이 데이터는 계약 및 제휴 내용에 근거하여 저작권의 보호 하에 검색 콘텐츠로서 사용하고 있습니다더불어 이러한 서비스가 ‘다음 쇼핑하우’ ‘다음 영화’, ‘다음 책’, ‘다음 부동산’, ‘다음 뮤직’ 등 자사 서비스로서 제공된다는 사실을 이용자가 쉽게 인지할 수 있도록 명시하고 있습니다.




    2.  검색 결과 노출 원칙의 구성 요소 및 구성 방법


가)    다음은 검색서비스를 제공함에 있 "한국형 통합검색방식을 활용하고 있습니다이용자가 입력하는 ‘검색어에 대해서 뉴스블로그카페이미지동영상인물영화음악 및 쇼핑 등 이른바 컬렉션이라 명명된 개별적인 검색 결과를 모아서 한 화면에 보여주는 방식을 말합니다이는 이용자가 어떤 의도를 가지고 검색하는지를 입력된 검색어 만으로는 판단이 어렵기 때문에 검색 결과를 풍부하게 보여주고자 하는 의도를 담고 있습니다예컨대 ‘이효리’ 를 검색하는 이용자가 이효리의 나이를 알고 싶은 것인지사진을 보고 싶은 것인지음악을 찾는 것인지 알 수 없기 때문입니다.


나)    검색 결과의 핵심은 그 결과가 이용자의 질문에 적합도가 높은 정보인지에 대한 여부입니다이 적합도를 구성하는 요소는 컬렉션이 가지는 고유의 특성에 따라서 조금씩 다를 수 있습니다만유사성문서품질최신성이용자가의 피드백 등이 있습니다아래는 구성 요소에 대한 간략한 정보입니다.

     유사성검색 결과로 제시된 문서가 이용자가 입력한 검색어와 얼마나 유사한 내용을 포함하고 있는지 여부를 말합니다제목본문 등 문서의 중요한 영역에 검색어가 포함될 경우유사성이 높다고 할 수 있습니다.


     문서품질내용이 부실한 문서의 제목에 이용자가 입력한 검색어가 있다고 해서이를 검색 결과물로 보여준다면 이용자의 불편만 가중될 수 있습니다따라서 문서자체의 기본 품질도 적합도의 중요 요소가 됩니다.
입력된 검색어와 상관 없이 문서 자체가 얼마나 좋은지 여부와 문서를 구성하는 주제의 일관성 그리고 콘텐츠의 내용이 풍부할 수록 상대적으로 품질이 높게 평가됩니다.
또한 댓글이나 트랙백 등 다른 이용자들과 교류가 많은 문서조회수가 많은 문서들 즉인기가 많은 문서는 품질이 높게 평가됩니다더불어 문서 작성자가 평소 좋은 글을 많이 쓰는지 여부 등도 품질 판단 요소가 될 수 있습니다.


     최신성문서가 얼마나 최근에 작성되었는지 여부를 말합니다일반적으로 검색어를 입력한 시점과 검색 결과로 보여질 문서의 작성 시점의 차이가 적게 날수록 관련성이 높다고 볼 수 있습니다또한최근에 작성된 문서는 그 문서가 담고 있는 내용이 유효할 가능성도 높습니다.
다만컬렉션의 종류에 따라 최신성을 고려하는 비중이 다를 수 있습니다뉴스처럼 새로운 정보에 대한 수요가 많은 경우와 지식처럼 고정된 정보를 주로 다루는 경우는 최신성을 고려하는 비중이 상반될 수 있는 것이 그것입니다.
검색어 자체에서도 최신성을 고려하는 비중이 상이 할 수 있는데, ‘제자백가’ 같은 검색어에 비해 ‘박지성 골’ 같은 경우최신성 비중이 높은 것을 예로 들 수 있습니다.


     이용자의 반응이용자가 검색 결과를 소비하기 위하여 보여주었던 일련의 행태 정보는 적합도를 확인할 수 있는 중요한 요소입니다. 
대표적으로, 어떠한 컬렉션 또는 문서가 검색 결과 내에서 상위에 노출되었음에도 불구하고 클릭이 많이 발생하지 않는 경우는 이용자의 낮은 만족도에 기인했다고 해석할 수도 있습니다. 반대로 클릭이 많이 발생했거나 해당 검색 결과를 오랜 시간 소비한 경우 그리고 해당 결과를 소비한 이 후 다른 검색 결과를 소비하지 않았다면 그 문서 혹은 컬렉션에서 가장 높은 검색 만족도를 얻었다고 해석할 수도 있습니다.
이와 같이 다음은 이용자의 검색 결과 만족도에 도움이 되는 정보 및 요소들과 그 반대의 것들을 지속적으로 확인하고 있으며, 검색 결과 만족도를 떨어뜨리는 요소가 발견되면 추후 검색 결과를 구성함에 있어 적절한 조치를 취하고 있습니다.


     적합도 방해요소 4가지와는 상반되는 검색의 적합도에 방해가 되는 요소들이 존재하며 다음과 같습니다.

       - 성인 콘텐츠

       - 마약도박 등의 불법적 콘텐츠

       - 영화음악서적 등의 저작권을 침해하는 콘텐츠

       - 주민등록번호 등 타인에 의해서 불법적으로 활용될 개인정보가 포함된 콘텐츠

       - 의도적으로문서 클릭 시 해당 문서가 아닌 다른 문서로 이동하게 하게하거나  문서내에 악성코드가 있는 콘텐츠

       - 키워드이미지링크 처리 등을 통해서 비정상적인 방법으로 만들어진 콘텐츠

       - 특정 키워드를 반복해서 작성하든 등 대량반복적인 방법으로 만들어진 콘텐츠

       - 상업적인 목적을 위해서 만들어진 콘텐츠


다)    즉 다음 검색에서 생각하는 좋은 문서는 다음과 같습니다.

     어떤 대상에 대한 생각이나 경험한 내용을 작성자가 본인이 직접 작성하여 검색 이용자들로 하여금 실제적 정보를 제공 할 수 있는 문서

     내용을 이해하는데 도움을 주는 사진지도 등의 부가정보가 풍부한 문서

     비교적 최신의 신뢰할 수 있는 정보를 담고 있는 문서

     비슷한 내용의 많은 문서 보다 그 문서만의 고유한 정보가 있는 소수의 문서

     영리목적이 아닌 웹 콘텐츠 생산을 위한 순수한 목적으로 작성된 문서


라)    이와 같은 적합도를 기준으로 선별된 적합한 문서들은 이용자가 검색어를 입력함으로써 확인 할 수 있습니다검색은 이용자가 검색어를 입력하면검색엔진이 다음이 수집하거나 새롭게 구성한 결과물과 검색어 간의 적합도를 계산하고 그 확률이 높은 순서대로 보여주게 됩니다헌데이 과정에서 다음이 자체적으로 서비스하는 정보를 우대하여 타 서비스 정보보다 무조건 먼저 보여준다면검색 품질이 떨어질 수 밖에 없습니다때문에검색 적합도를 최우선 목표로 하는 다음에서는 자사 서비스 외에 다른 서비스에 대해 차별하지 않습니다.
다음은 다음의 문서와 외부로부터 수집 혹은 제공된 문서를 노출하는 방법에 있어이처럼 문서들의 출처를 구분하지 않고이용자가 입력한 검색어와 적합할 확률이 높은 문서를 먼저 보여주는 정책을 가지고 있습니다.


마)    더불어 검색어에 따라 제시되는 컬렉션 및 컬렉션을 구성하는 문서의 종류와 숫자는 최적의 검색 결과를 위해 자동으로 결정되며 수정이 불가능합니다인위적으로 개입해 검색 결과를 조정 할 경우오히려 이용자의 검색 만족도와 서비스의 경쟁력을 떨어뜨릴 수 있기 때문입니다.


바)    또한다음은 검색 품질을 높이기 위해서 이용자의 검색 활용 정보를 적극 반영하고 있습니다이를 반영해 적합도와 관련된 다양한 요소들의 가중치를 재구성 하는 개선 작업을 꾸준히 수행하고 있습니다일반적으로 임의로 추출된 검색어를 별도의 ‘평가자 그룹을 통해서 검색 만족도를 평가하며그 결과를 검색 품질 개선에 반영하는 방법을 사용하고 있습니다때문에 검색 결과는 검색 시점에 따라 다르게 나타날 수 있습니다.


    3.  검색어 서비스 원칙


가)    다음은 일반적인 문서 결과 이외에도 이용자의 편의를 위하여 실시간 이슈 검색어관련검색어서제스트 등과 같은 검색어 서비스를 제공하고 있습니다.

     실시간 이슈검색어다음 이용자들이 검색창에 입력한 검색어들을 실시간으로 수집한 후과거 검색 유입량에 비해 검색빈도가 급등한 검색어를 순위로 보여주는 서비스입니다이용자들의 관심이 집중된 키워드를 실시간으로 보여줌으로써 이용자들의 편의를 도모하는데 그 목적이 있습니다.


     서제스트다음 이용자가 많이 입력한 검색어 조합을 검색어 입력 시에 추천해주는 서비스입니다이용자가 입력한 검색어를 기반으로 꾸준히 유입된 키워드와 최근 유입이 높은 키워드를 대상으로 구성됩니다이용자의 입력 시간을 최소화하고입력한 검색어에 관한 다양한 정보를 제시함으로써 이용자의 편의를 도모하는데 그 목적이 있습니다.


     관련검색어다음 이용자가 입력한 검색어들을 분석하여 관련성이 높은 검색어를 추천하는 서비스입니다. 이용자가 입력한 검색어와 콘텐츠를 분석하여 시스템에 의해 자동 추출하고 있으며 꾸준히 변화됩니다. 이용자가 입력한 검색어와 관련된 다양한 검색어를 제공함으로써 검색 편의성을 높이고 정보 취득의 용이성 높이는데 그 목적이 있습니다.


나)    이러한 서비스는 이용자들의 높은 관심에 따라서 일반문서 검색 결과와 마찬가지로 공정하고 적합한 서비스 제공을 위하여 다음과 같은 운영 원칙을 가지고 있습니다.

     필터링검색어 서비스는 이용자들에게 불쾌감을 주거나 사회적 혼란을 야기시킬 수 있는 정보를 배제하기 위해서 다음과 같은 자사 검색어 노출 기준 등에 따라 검수됩니다.

       - 성인/음란 키워드

       - 불법/범죄/유해 정보

       - 개인정보 노출

       법원의 판결이나 행정처분

       - 모욕 욕설 비속어 사용 등 서비스 품질 저해

       - 특정 목적을 가진 고의적 검색어 과다 입력 행위


     최소한의 제어다음은 ‘서제스트 ‘관련검색어’ 를 인위적으로 조정하지 않으며 자사 필터링 기준에 위배되는 검색어에 대해서 최소한의 제어를 하고 있습니다이용자 보호를 위하여 이용자가 명예훼손 등의 이유로 삭제를 요청할 경우한국인터넷자율정책기구(KISO) 정책에 조치 를 취하게 됩니다이 경우공인의 공적 업무와 관련된 내용은 허위 사실 여부가 소명되어야 합니다.


     다음은 검색 서비스를 함에 있어서 항상 위 원칙을 준수 하고 있으며이용자가 더 좋은 결과를 확인 할 수 있을 수 있도록 끊임없이 연구하고 있습니다. 이용자에게 도움이 될 수 있는 원칙의 유지보완 및 개선을 위해서 앞으로도 더욱더 노력하도록 하겠습니다.

위 도움말에 만족하셨나요?
접기

원하시는 답변을 찾지 못하셨다면, 고객센터에 문의하여주세요

문의하기