웹문서 검색

9개 도움말

정렬 방식
[웹문서 검색] 다음 웹문서 검색이란?
다음 웹문서 검색이란?

다음(Daum) 웹문서 검색이란, 인터넷에 존재하는 다양한 출처의 웹문서를 웹문서 수집 로봇이 수집해 

검색 결과로 제공하는 서비스입니다.


다음 검색은 뉴스, 카페, 블로그 검색 등 특화된 검색을 제공하고 있습니다. 그러나 인터넷상에서는 다양한 출처의 

많은 웹문서가 존재합니다.

따라서 카카오는 이러한 웹문서를 효율적으로 수집하고 만족스러운 검색 결과 제공을 위해 아래와 같은 과정을 거칩니다.


1) 카카오는 Daumoa 혹은 Daum이라 불리는 웹문서 수집 로봇을 다음 웹문서 검색에 사용합니다.


2) 카카오 웹문서 수집 로봇은 문서에 포함된 ‘링크’를 따라다니면서 새로운 웹문서를 지속해서 수집합니다.


3) 카카오 웹문서 수집 로봇은 수집 과정에서 “http://www.robotstxt.org/”에 명시된, 방문하는 사이트에서 요구하는 

     로봇 규칙을 준수합니다. 또한, 방문했던 사이트의 로봇 규칙이 변경될 경우, 이를 빠르게 반영합니다.

     카카오와 업무 협약을 맺은 일부 사이트는 카카오 웹문서 수집 로봇에 특화된 로봇 규칙을 제공하며, 

     카카오는 해당 규칙을 준수합니다.


4) 카카오는 다음 검색 서비스 정책에 따라 수집된 웹문서의 사용 가능 여부를 검토합니다.


5) 사용 가능한 웹문서는 다음 검색 서비스에서 활용하기 위해 웹문서의 요소를 추출 및 분석하는 ‘색인’ 과정을 거칩니다.


6) 색인이 완료된 웹문서는 이용자가 입력한 키워드에 따라 최적의 순서로 노출되며, 

     노출 순서는 다음 검색 결과 정책에 따릅니다.


7) 수집된 웹문서는 웹문서 검색 이외의 다른 목적으로 사용되지 않습니다.


참고: 다음봇

Mozilla/5.0 (compatible; MSIE or Firefox mutant; not on Windows server;) Daum 4.1 

Mozilla/5.0 (compatible; MSIE or Firefox mutant; not on Windows server;) Daumoa 4.1

위 도움말에 만족하셨나요?
접기
[웹문서 검색] ‘저장된 페이지’는 어떤 기능인가요?
‘저장된 페이지’는 어떤 기능인가요?

“저장된 페이지”는 검색 로봇이 웹문서를 수집한 당시의 문서 내용을 그대로 보여주는 기능입니다.


검색 수집 후에 문서 내용이 수정/삭제되었거나, 해당 페이지로의 연결이 어려워져 내용을 확인하기 힘들 때 사용할 수 있는 기능입니다.



위 도움말에 만족하셨나요?
접기
[웹문서 검색] ‘사이트 내 검색’은 어떤 기능인가요?
‘사이트 내 검색’은 어떤 기능인가요?

사이트 내 검색” 은 해당 웹문서가 포함된 사이트 안에서 문서를 찾아주는 서비스입니다. 


"사이트 내 검색" 을 클릭하면 해당 사이트의 문서들 중에서 입력한 검색어가 포함된 문서를 선별하여 보여드립니다.


비슷한 기능으로는, 검색창에 ‘site:웹사이트주소+검색어’ 를 입력하면 해당 웹사이트의 문서만을 검색할 수 있습니다.

예를 들어 검색창에 ‘site:tistory.com 다음검색’ 을 입력하면, 'tistory.com' 사이트 내 ‘다음검색’ 이라는 단어를 포함하는 

웹문서를 찾아 드립니다.



위 도움말에 만족하셨나요?
접기
[웹문서 검색] 웹문서 검색결과에 안 나왔으면 하는 게 있어요.
웹문서 검색결과에 안 나왔으면 하는 게 있어요.

웹문서 검색결과에서 제외하고 싶은 문서가 있다면 아래의 내용을 참고하세요.

[1 단계] 해당 문서의 작성자 또는 해당 문서가 올라온 사이트 관리자에게 삭제를 요청해주세요.

[2 단계] 해당 문서의 작성자나 사이트 관리자를 통해 삭제가 어려운 상황이라면, 아래와 같은 사유에 해당할 경우

문의하기를 통해 웹문서 검색결과 제외를 요청할 수 있습니다.


1. 개인정보 유출(주민등록번호, 특정 사이트 ID/PW, 핸드폰 번호, 주소 등)

2. 성인 사이트로 연결

3. 링크가 깨지거나 안 열리는 페이지

4. 기타 Daum 검색 규정에 어긋난 검색결과


문의하기 바로가기


위 도움말에 만족하셨나요?
접기
[웹문서 검색] 내 사이트의 문서를 웹문서 검색결과에서 자동으로 제외하고 싶어요.
내 사이트의 문서를 웹문서 검색결과에서 자동으로 제외하고 싶어요.

[robots.txt 파일을 이용하여 제외하기]

메모장에 아래와 같은 내용을 작성하신 후, robots.txt 파일로 저장하셔서 루트 디렉토리에 올리시기 바랍니다. 


User-agent : DAUM 

Disallow : /


DAUM 대신 * 를 쓰면 Daum 뿐만 아니라 모든 검색서비스에서 웹수집 로봇이 문서를 수집해가는 것을 막을 수 있습니다. 



[Meta tag를 이용하여 제외하기] 
 사이트의 HTML/CSS편집에서 아래와 같은 내용을 Meta tag로 등록하시기 바랍니다.
Meta tag는 HTML의 <head>와 </head> 사이에 들어가야 합니다.


<META name=”robots” content=”noindex, nofollow”>


위 도움말에 만족하셨나요?
접기
[웹문서 검색] 내 사이트의 문서를 웹문서 검색결과에 나오게 하고 싶어요.
내 사이트의 문서를 웹문서 검색결과에 나오게 하고 싶어요.

[1 단계] 해당 사이트가 검색 로봇 (크롤러) 차단 설정이 되어 있는 것은 아닌지 확인해주세요.


[2 단계] 검색 로봇이 차단되어 있지 않다면, 문서 내용이 아래의 규제 대상에 포함되는 것은 아닌지 확인해주세요.

1. 청소년 유해

2. 과도한 광고

3. 저작권 위배

4. 개인정보 노출

5. 다른 웹문서와 중복

6. 기타 Daum 검색 규정에 어긋난 검색결과


[3 단계] 위의 사항들을 확인하신 후 해당 사이트가 웹문서 검색결과에 맞는 조건을 갖추고 있다면, 

문의하기를 통해 웹문서 등록을 요청해주세요. 웹문서 등록의 경우, 약 1~2일 이내 처리해드리고 있습니다. 


문의하기 바로가기


위 도움말에 만족하셨나요?
접기
[웹문서 검색] 문서를 수정했는데 검색결과에는 수정 전 문서가 나와요.
문서를 수정했는데 검색결과에는 수정 전 문서가 나와요.

검색결과에 표시되는 문서 제목과 본문 내용은 검색 로봇이 해당 문서를 등록한 당시의 상태로 보입니다. 
정확한 결과 제공을 위해 지속적으로 업데이트를 하고 있지만, 실시간으로 수정 사항을 반영하기가 어려워 

검색결과에 표시되는 내용과 실제 글의 내용이 다른 경우가 있습니다. 
이와 같은 경우 시간이 지나면 자동으로 최신 내용으로 업데이트가 됩니다.


급하게 수정이 필요한 경우 혹은 3주 이상 웹문서의 검색결과 내용이 업데이트가 안되고 있는 경우

문의하기를 통해 수정을 요청해주세요.

문의하기 바로가기


위 도움말에 만족하셨나요?
접기
[웹문서 검색] "위 사이트의 robots.txt를 준수하여, 관련 정보를 보여드리지 못하였습니다" 메시지는 어떤 의미인가요?
"위 사이트의 robots.txt를 준수하여, 관련 정보를 보여드리지 못하였습니다" 메시지는 어떤 의미인가요?

로봇 배제 표준(Robots Exclusion Standard)은 사이트의 루트에 위치하는 robots.txt를 통해 설정되며, 

웹문서 수집 로봇이 사이트 내 정보를 수집하는 것을 허용 또는 제한하는 일종의 로봇 규칙입니다.

사용자는 robots.txt에 명시한 로봇규칙 이외로, 웹페이지의 meta tag 안에 로봇룰을 명시하여 특정 웹페이지의 수집을 

제한할 수 있으며, 카카오는 다양한 출처의 웹문서 수집 시에 이 로봇 배제 표준을 명확하게 준수하고 있습니다.



"위 사이트의 robots.txt를 준수하여, 관련 정보를 보여드리지 못하였습니다"와 같은 메시지가 노출되는 것은, 

로봇 배제 표준에 따라 다음 웹문서 결과에 해당 사이트의 정보를 보여주지 못하는 경우이며, 

이는 사이트를 소유한 사용자가 의도를 가지고 robots.txt에 카카오의 웹문서 수집 로봇을 제한한 경우입니다.

카카오는 사용자의 만족스러운 검색 결과 제공을 위해 로봇을 이용해 웹문서 수집을 하고 있지만, 

그보다 앞서 웹페이지 소유자의 로봇 설정 의도를 가장 존중하며, 이에 로봇 배제 표준을 준수합니다.


웹문서 수집이 제한된 페이지임에도 불구하고 다음 웹문서 결과에 해당 페이지의 제목 정보가 노출되는 것은, 

다른 웹페이지에서 해당 수집 제한 페이지의 링크를 걸 때 사용되는 Anchor Text의 분석 이후 선택된 정보가 

사용되기 때문입니다.


웹문서 수집을 허용하도록 로봇룰 설정하기

1. 사용자가 소유한 사이트 내의 문서를 다음 웹문서 검색결과에 나오게 하고 싶다면, 

사이트의 robots.txt를 아래와 같이 설정해 주세요.

(설정한 내역은 웹검색에 반영되기까지 약간의 시간이 걸릴 수 있습니다.)


user-agent:Daum

allow: /

user-agent:Daumoa

allow: /


2. 만약 로봇룰 설정을 변경하였는데도 다음 웹검색에 노출이 되지 않는다면,

웹페이지의 meta tag안에 noindex 로봇룰이 설정되어 있는지 확인해 주세요.


참고: 다음봇

Mozilla/5.0 (compatible; MSIE or Firefox mutant; not on Windows server;) Daum 4.1 

Mozilla/5.0 (compatible; MSIE or Firefox mutant; not on Windows server;) Daumoa 4.1


위 도움말에 만족하셨나요?
접기
[웹문서 검색] 내 블로그가 블로그이름 검색결과에 안 나와요.
내 블로그가 블로그이름 검색결과에 안 나와요.

검색 결과에 내가 운영하는 블로그가 나오게 하고 싶다면 아래 내용을 참고하세요. 

Daum 블로그 이용자
1. 검색결과에 내 블로그가 나오지 않는 경우, 블로그 설정이 ‘전체공개’인지 확인해주세요. 
‘비공개' 혹은 '친구공개’인 경우에는 검색결과에 노출되지 않습니다. 

2. 만약 블로그가 '공개 설정'되어 있는데도 검색결과에 안 나오는 경우, 문의하기를 통해 요청하세요. 

외부 블로그 이용자
[1 단계] 사용하고 계신 블로그 서비스에서 제공하는 검색 공개 설정 기능을 확인해 보시고, 블로그 검색을 허용하도록 설정해주세요. 또는 Robot.txt 파일이 설정되어 있는지 확인해주세요. 

[2 단계] 만약 블로그가 공개 설정이 되어 있는데도 검색결과에 안 나오는 경우, 문의하기를 통해 요청하세요. 
단, 블로그이름이 없는 블로그는 블로그이름 검색에서 노출되지 않습니다.

문의하기 바로 가기

위 도움말에 만족하셨나요?
접기

원하시는 답변을 찾지 못하셨다면, 고객센터에 문의하여주세요

문의하기