@ZEAL Blog·厉
We stand alone,
TOGETHER.

Google Sitemaps(BETA)

Posted by zeal on 2005-06-20 12:14 , 3380 characters |  + 0 - 1   English
转载请保留本行原始出处声明信息 : http://www.zeali.net/entry/96 MaDe1nZEAL
标签 ( 网络 ):  ,  , 
Google推出的测试版本采用xml格式。网站管理员只需要在站点目录下放置相应的包含所有希望google进行编录的url相关信息的xml数据文件,将更快、更全面、更准确的根据这些信息来收录网站内容。这样就使得无须再去分析一大堆的html代码--这些代码可能百分之九十都是为显示服务而非为搜索机器人服务的,同时也能为网站节约一部分的带宽资源。

目前测试版本有几点需要注意:

  1. 要求xml文件必须使用UTF-8编码格式。
  2. 单个sitemap xml文件的大小不能超过10M,并且文件包含的URL的数量不得超过50,000个。
  3. 可以在站点目录下放置多个sitemap xml文件,但必须要额外提供一个sitemap index文件,以对这些数据文件进行索引。
  4. 每个sitemap index文件最多只能索引1,000个数据文件。
  5. 这些xml文件只能包含所在域名的URL,如果文件放置在子目录下则只能对该子目录内的URL进行编制。
  6. 可以对sitemap文件进行压缩,但必须使用gzip
  7. 文件里面的所有URL都必须是XML Encoded

sitemap index文件示例:
<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.google.com/schemas/sitemap/0.84">
   <sitemap>
      <loc>http://www.example.com/sitemap1.xml.gz</loc>
      <lastmod>2004-10-01T18:23:17+00:00</lastmod>
   </sitemap>
   <sitemap>
      <loc>http://www.example.com/sitemap2.xml.gz</loc>
      <lastmod>2005-01-01</lastmod>
   </sitemap>
</sitemapindex>

sitmap 文件示例:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.google.com/schemas/sitemap/0.84">
   <url>
      <loc>http://www.yoursite.com/</loc>
      <lastmod>2005-01-01</lastmod>
      <changefreq>monthly</changefreq>
      <priority>0.8</priority>
   </url>
   <url>
      <loc>http://www.yoursite.com/catalog?item=12&desc=vacation_hawaii</loc>
      <changefreq>weekly</changefreq>
   </url>
   <url>
      <loc>http://www.yoursite.com/catalog?item=73&desc=vacation_new_zealand</loc>
      <lastmod>2004-12-23</lastmod>
      <changefreq>weekly</changefreq>
   </url>
   <url>
      <loc>http://www.yoursite.com/catalog?item=74&desc=vacation_newfoundland</loc>
      <lastmod>2004-12-23T18:00:15+00:00</lastmod>
      <priority>0.3</priority>
   </url>
   <url>
      <loc>http://www.yoursite.com/catalog?item=83&desc=vacation_usa</loc>
      <lastmod>2004-11-23</lastmod>
   </url>
</urlset>

提交你的sitemap xml(用gmail帐号可以直接登录):
https://www.google.com/webmasters/sitemaps/login

google的官方帮助信息:
https://www.google.com/webmasters/sitemaps/docs/en/faq.html

另外,似乎你可以直接把自己的rss xml源提交给Google Sitemaps,它能够自动识别出你这是rss feed。但至于作用是否跟sitemap xml一样,目前没法检验。

本站的Sitemaps index xml:

http://www.zeali.net/sitemap_feed_index.xml

Last Modified on 2005-07-01 14:42
3 条评论:
- charmlike2005-06-23 17:28
正在研究这个中
- 子鼠 () (link) 于 2006-09-24 21:14
我想问一下GOOGLE是怎么样识别索引文件的?文件名一定用“sitemap_feed_index.xml”吗?
- zeal (link) 于 2006-09-24 22:18
不需要。你可以在 http://www.google.com/webmasters/sitemap.. 去提交你的 sitemap 文件。
Since 2005.04.27  梦想 就像鸡蛋 要么孵化 要么臭掉RSS Feed (Entries) | Back To Home | @ZEAL | 沪ICP备05024379号