수집 Seed URL 등록
- Daum 검색 수집 로봇(크롤러)에게 사이트 내에 수집대상 페이지들을 알려 주기 위한 방법으로,
검색 수집 로봇이 사이트 콘텐츠를 더 잘 수집할 수 있도록 도울 수 있습니다.
- Seed URL은 RSS 피드, Atom 피드, 리스트 페이지 또는 사이트맵 형식의 URL을 지원합니다.
- Seed URL 등록 여부와는 무관하게 Daum 검색 기준에 따라 검색 노출 됩니다.
- Daum 검색 수집 로봇의 상태 및 사이트 문서량에 따라서 수집까지 수개월 소요 될 수 있습니다.
- 수집한 문서의 재방문 정책은 Daum 검색 수집 로봇의 수집 주기에 따라서 수집까지 수개월 소요 될 수 있습니다.
- Seed URL 등록 후 검색이 안된다면 도움말을 참조하세요.
RSS 피드, Atom 피드, 리스트형 페이지 URL 제출
1. RSS 피드
- RSS 피드는 뉴스나 블로그 사이트에서 주로 사용하는 XML기반의 콘텐츠 표현 방식입니다.
2. Atom 피드
- Atom 피드는 웹로그나 최신 소식, 블로거, 라이브저널 같은 웹 콘텐츠를 표현하는 XML 기반의 콘텐츠 표현 방식입니다.
3. 리스트 페이지
- 리스트로 작성된 웹페이지로 리스트로 연결된 URL을 1단계까지 수집 합니다.제출된 주기에 맞추어 수집을 진행하며,
리스트에 신규글이 등록되면 신규 글 URL을 Daum 검색 수집 로봇이 수집하는 유형입니다. 리스트 페이지의 첫 번째 페이지만 등록 가능합니다.
RSS 피드 형식 예시
<?xml version="1.0" encoding="UTF-8" ?>
<rss version="2.0">
<channel>
<title>example</title>
<link>https://www.example.com</link>
<description>This is rss feed example</description>
<item>
<title>RSS Example1</title>
<link>https://www.example.com/rss/feed/1</link>
<description>RSS Feed example</description>
</item>
<item>
<title>RSS Example2</title>
<link>https://www.example.com/rss/feed/2</link>
<description>RSS Feed example</description>
</item>
</channel>
</rss>
Atom 피드 형식 예시
<?xml version="1.0" encoding="utf-8"?>
<feed xmlns="http://www.w3.org/2005/Atom">
<title>Example Feed</title>
<link href="http://example.org/"/>
<updated>2003-12-13T18:30:02Z</updated>
<author>
<name>John Doe</name>
</author>
<id>urn:uuid:60a76c80-d399-11d9-b93C-0003939e0af6</id>
<entry>
<title>Atom-Powered Robots Run Amok</title>
<link href="http://example.org/2003/12/13/atom03"/>
<id>urn:uuid:1225c695-cfb8-4ebb-aaaa-80da344efa6a</id>
<updated>2003-12-13T18:30:02Z</updated>
<summary>Some text.</summary>
</entry>
</feed>
사이트맵 URL 제출
- 사이트맵
- 사이트맵은 Daum 검색 수집 로봇에게 사이트 내 수집대상 페이지들을 알려 주기 위하여 마련된 표준 규약으로 사이트맵은 수집대상 URL을 나열하여 제공하는 XML 파일입니다.사이트맵을 활용하면 Daum 검색 수집 로봇이 해당 파일을 읽고 콘텐츠를 좀더 효율적으로 수집할 수 있도록 도울 수 있습니다.
- 사이트맵 제출시 제약사항
- 제출하는 사이트맵 파일내 모든 URL의 호스트는 최초 수집 요청한 URL의 호스트와 동일한 호스트여야 합니다.
- 파일마다 URL을 50,000개 까지만 포함할 수 있습니다.
(50,000개 이상의 URL일 경우, sitemapindex 형식의 파일을 제출하세요.)
- 파일 크기는 50MB를 초과 할 수 없습니다.
(파일의 압축을 풀었을 때에도 50MB를 초과할 수 없습니다.)
- 사이트맵 형식은 sitemaps.org에서 자세히 확인 할 수 있습니다.
- 사이트맵 작성 예시
- 수집 대상 URL을 포함하는 사이트맵
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.example.com/1</loc>
<lastmod>2005-01-01</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>
</urlset>
- 또 다른 사이트맵 인덱스를 포함하는 사이트맵 인덱스
<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<sitemap>
<loc>http://www.example.com/sitemap_index.xml</loc>
<lastmod>2021-01-01</lastmod>
</sitemap>
</sitemapindex>
- 또 다른 사이트맵을 포함하는 사이트맵 인덱스(압축유형)
<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<sitemap>
<loc>http://www.example.com/sitemap.xml.gz</loc>
<lastmod>2021-01-01</lastmod>
</sitemap>
</sitemapindex>