이번 포스팅은 지난 포스팅에 이어 구글 웹마스터 도구에 대하여 좀 더 자세하게 살펴보려 합니다.

웹마스터 도구가 무엇에 쓰는 물건인지와 기초 세팅 방법은 지난 포스팅을 참고하세요(지난 포스팅 보기).

소유권 인증을 마친 후 웹마스터 도구에 접속을 하시면 크게 4가지 메뉴가 보여집니다.
  • 사이트 구성
  • 내 웹사이트 데이터
  • 진단
  • 실험실
이중 오늘은 "사이트 구성 - Sitemaps"에 대해 이야기 하려 합니다.

"사이트 구성" 메뉴를 클릭 하시면 하위 메뉴들이 보여집니다..

- Sitemaps : 사이트 페이지들의 URL 및 정보를 구글에 알려주는 기능을 합니다.
      즉 구글 검색로봇이 우리 사이트를 쉽게 크롤링 하도록 페이지들의 정보를 제공하는 역활을 합니다.

그럼 이 Sitemap은 어떻게 작성해야 하는 살펴 보겠습니다.
Sitemap은 http://www.sitemaps.org 의 양식에 따라 작성을 해야 합니다. 그리고 구글은 물론 야후, 빙에서도 이 양식을 채택하여 사용중이랍니다.

- Sitemap XML 양식
  • 여는 <urlset> 태그로 시작해 닫는 </urlset> 태그로 끝납니다
  • <urlset> 태그 안에 네임스페이스(프로토콜 표준)를 지정합니다.
  • 각 URL의 <url> 항목을 상위 XML 태그로 포함시켜야 합니다.
  • 각 <url> 상위 태그에 <loc> 하위 항목을 포함시켜야 합니다
이렇게 보니 뭔가 상당히 어렵게 느껴지내요. 직접 Sitemap 샘플을 살펴 보겠습니다.

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
   <url>
      <loc>http://www.example.com/</loc>
      <lastmod>2005-01-01</lastmod>
      <changefreq>monthly</changefreq>
      <priority>0.8</priority>
   </url>
</urlset>

그리고 사용 가능한 XML 태그에 대해서는 아래에 설명되어 있습니다.
속성 설명
<urlset> 필수 파일을 캡슐화하고 현재 프로토콜 표준을 참조합니다.
<url> 필수 각 URL 항목의 상위 태그. 나머지 태그는 이 태그의 하위 태그입니다.
<loc> 필수 페이지의 URL. 해당 URL은 http 같은 프로토콜로 시작해야 하며 웹서버에 따라 슬래시로 끝나야 합니다. 이 값은 2,048자 미만이어야 합니다.
<lastmod> 옵션 파일을 마지막으로 수정한 날짜입니다. 이 날짜는 W3C Datetime 형식이어야 합니다. 이 형식에서는 시간 부분을 생략할 수 있으며 원하는 경우 YYYY-MM-DD 형식을 사용할 수 있습니다.
이 태그는 서버에서 반환할 수 있는 If-Modified-Since(304) 헤더와 다르므로 검색 엔진은 두 소스에서 다른 정보를 사용할 수 있습니다.
<changefreq> 옵션 페이지가 변경되는 빈도. 이 값은 검색 엔진에 일반적인 정보를 제공하며 검색 엔진에서 페이지를 크롤링하는 정확한 빈도와는 관련이 없을 수도 있습니다. 유효한 값은 다음과 같습니다.
  • always
  • hourly
  • daily
  • weekly
  • monthly
  • yearly
  • never
값 "always"는 액세스할 때마다 변경되는 문서를 설명하는 데 사용해야 합니다. 값 "never"는 보관된 URL을 설명하는 데 사용해야 합니다.
태그의 값은 힌트 이지 명령이 아닙니다.검색 엔진 크롤러에서 결정을 내릴 때 해당 정보를 고려하더라도 "hourly"이라고 표시된 페이지를 이보다 더 적은 빈도로 크롤링하고 "yearly"이라고 표시된 페이지를 이보다 더 자주 크롤링할 수 있습니다.크롤러는 "절대 하지 않음(never)"이라고 표시된 페이지가 예기치 않게 변경되더라도 이를 처리할 수도 있도록해당 페이지도 정기적으로 크롤링합니다.
<priority> 옵션 해당 사이트의 기타 URL에 대한 특정 URL의 상대적 우선순위.유효값 범위는 0.0-1.0입니다.이 값은 다른 사이트의 페이지와 귀하의 페이지를 비교하는 방식에 아무런 영향을 주지 않으며, 귀하가 귀하의 사이트에서 크롤러에 가장 중요하다고 생각하는 페이지를 검색 엔진에 알리기만 합니다.
페이지의 기본 우선순위는 0.5입니다.
귀하가 페이지에 지정한 우선순위는 검색 엔진의 결과 페이지에서 URL의 순위에 별 영향을 미치지 않습니다.검색 엔진에서는 같은 사이트에 있는 URL 중 하나를 선택할 때 이러한 정보를 사용할 수 있으므로 해당 태그를 사용하면 같은 사이트 내에서 중요도가 높은 페이지가 검색색인에 나타나게 할 가능성을 높일 수는 있습니다.
또한 사이트의 모든 URL에 높은 우선순위를 지정해도 사이트의 순위를 높이는 데는 아무런 도움이 되지 않습니다.우선순위는 상대적인 것으로 사이트 내의 URL 중 하나를 선택하는 데만 사용됩니다.

Sitemap 작성법 및 각 태그의 의미를 알아봤습니다. 조금은 어려워 보일 수 있지만 천천히 읽어보시면 이해하기 쉽답니다.

그런데 한가지 주의 사항!!
Sitemap 파일에는 URL을 50,000개 까지만 포함이 가능 합니다. 또한 용량은 10MB 이하로 작성을 해야 합니다.
그렇다면 URL이 50,000개가 넘거나 용량이 10MB가 넘는다면 어떻게 해야 할까요?? 방법을 알려드리 겠습니다.

Sitemap 색인 파일을 사용하여 여러 Sitemap 파일을 그룹화하기
Sitemap 색인 파일은 다음 사항을 만족해야 합니다.
  • 여는 <sitemapindex> 태그로 시작해 닫는 </sitemapindex> 태그로 끝납니다.
  • 각 Sitemap의 <sitemap> 항목을 상위 XML 태그로 포함시키십시오.
  • 각 <sitemap> 상위 태그에 대한 <loc> 하위 항목을 포함시키십시오.
쉬운 이해를 위해 샘플을 보시겠습니다.

<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
   <sitemap>
      <loc>http://www.example.com/sitemap1.xml.gz</loc>
      <lastmod>2004-10-01T18:23:17+00:00</lastmod>
   </sitemap>
   <sitemap>
      <loc>http://www.example.com/sitemap2.xml.gz</loc>
      <lastmod>2005-01-01</lastmod>
   </sitemap>
</sitemapindex>

여러게의 Sitemap 파일을 작성 하셧다면 위의 샘플처럼 Sitemap 색인 파일을 작성 후 웹마스터 도구에서 색인 파일 경로를 등록 하시면 됩니다.

또한 robots.txt 파일을 이용하여 Sitemap 등록도 가능합니다. robots.txt 에 아래 형식으로 등록 하시면 됩니다.
Sitemap: http://www.example.com/sitemap-host1.xml

이렇게 설명을 드리고 보니 쉬운 내용을 좀 어렵게 설명한건 아닌가 생각이 드내요.....
우선 기본적인 Sitemap의 작성 방법과 의미는 이해 하셨으니 작성의 편의를 위한 팁을 알려 드리겠습니다.
검색엔진에 검색어를 "sitemap generator"라고 입력하시고 검색을 하시면 쉽게 Sitemap 을 작성 해주는 툴 및 사이트들을 쉽게 찾을수 있습니다.
사이트의 URL만 입력하면 자동으로 슉~~ 생성이 됩니다. 여러 종류의 툴이 있으니 입맛대로 골라 사용하세요~~

두서없는 긴 글은 여기서 마칠까 합니다. 쉬운 내용을 글로 작성하려니 어렵내요....
웹마스터 도구의 다른 기능들은 순서데로 다음에 또 포스팅 하도록 하겠습니다. 오늘은 이만 물러 갑니다~ ^^
top

Trackback Address :: http://blog.artience.co.kr/trackback/90 관련글 쓰기

Write a comment


◀ PREV : [1] : ... [69] : [70] : [71] : [72] : [73] : [74] : [75] : [76] : [77] : ... [147] : NEXT ▶