Zeal Blog - 泽欧里
梦想 就像鸡蛋
要么孵化 要么臭掉
WWW Zeal Blog

Google Sitemaps(BETA)

zeal 2005-06-20 12:14 于 网络 , 3380 字 |  + 0 - 1   English
Made In Zeal 转载请保留原始链接:http://www.zeali.net/entry/96
标签 ( Tags ):  ,  , 
Google推出的测试版本采用xml格式。网站管理员只需要在站点目录下放置相应的包含所有希望google进行编录的url相关信息的xml数据文件,将更快、更全面、更准确的根据这些信息来收录网站内容。这样就使得无须再去分析一大堆的html代码--这些代码可能百分之九十都是为显示服务而非为搜索机器人服务的,同时也能为网站节约一部分的带宽资源。

目前测试版本有几点需要注意:

  1. 要求xml文件必须使用UTF-8编码格式。
  2. 单个sitemap xml文件的大小不能超过10M,并且文件包含的URL的数量不得超过50,000个。
  3. 可以在站点目录下放置多个sitemap xml文件,但必须要额外提供一个sitemap index文件,以对这些数据文件进行索引。
  4. 每个sitemap index文件最多只能索引1,000个数据文件。
  5. 这些xml文件只能包含所在域名的URL,如果文件放置在子目录下则只能对该子目录内的URL进行编制。
  6. 可以对sitemap文件进行压缩,但必须使用gzip
  7. 文件里面的所有URL都必须是XML Encoded

sitemap index文件示例:
<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.google.com/schemas/sitemap/0.84">
   <sitemap>
      <loc>http://www.example.com/sitemap1.xml.gz</loc>
      <lastmod>2004-10-01T18:23:17+00:00</lastmod>
   </sitemap>
   <sitemap>
      <loc>http://www.example.com/sitemap2.xml.gz</loc>
      <lastmod>2005-01-01</lastmod>
   </sitemap>
</sitemapindex>

sitmap 文件示例:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.google.com/schemas/sitemap/0.84">
   <url>
      <loc>http://www.yoursite.com/</loc>
      <lastmod>2005-01-01</lastmod>
      <changefreq>monthly</changefreq>
      <priority>0.8</priority>
   </url>
   <url>
      <loc>http://www.yoursite.com/catalog?item=12&desc=vacation_hawaii</loc>
      <changefreq>weekly</changefreq>
   </url>
   <url>
      <loc>http://www.yoursite.com/catalog?item=73&desc=vacation_new_zealand</loc>
      <lastmod>2004-12-23</lastmod>
      <changefreq>weekly</changefreq>
   </url>
   <url>
      <loc>http://www.yoursite.com/catalog?item=74&desc=vacation_newfoundland</loc>
      <lastmod>2004-12-23T18:00:15+00:00</lastmod>
      <priority>0.3</priority>
   </url>
   <url>
      <loc>http://www.yoursite.com/catalog?item=83&desc=vacation_usa</loc>
      <lastmod>2004-11-23</lastmod>
   </url>
</urlset>

提交你的sitemap xml(用gmail帐号可以直接登录):
https://www.google.com/webmasters/sitemaps/login

google的官方帮助信息:
https://www.google.com/webmasters/sitemaps/docs/en/faq.html

另外,似乎你可以直接把自己的rss xml源提交给Google Sitemaps,它能够自动识别出你这是rss feed。但至于作用是否跟sitemap xml一样,目前没法检验。

本站的Sitemaps index xml:

http://www.zeali.net/sitemap_feed_index.xml

This Entry was Last Modified on 2005-07-01 14:42
引用本文(TrackBack): 此功能无限期关闭ing ... 如有引用请在文中标明出处并提供超链接  
3 条评论:
- charmlike 于 2005-06-23 17:28
正在研究这个中
- 子鼠 () (link) 于 2006-09-24 21:14
我想问一下GOOGLE是怎么样识别索引文件的?文件名一定用“sitemap_feed_index.xml”吗?
- zeal (link) 于 2006-09-24 22:18
不需要。你可以在 http://www.google.com/webmasters/sitemap.. 去提交你的 sitemap 文件。
对于这篇日志您有什么想法?我想听听您的高见。
如果您不是没有思想的机器Spammer,请告诉我 4 + 8 =
然后任选以下两种方式之一告诉我您的身份:
1. 使用您的 OpenID
2. 使用传统留言格式
(必填) 名字
如何称呼您?
(选填) URL
在此填写您的 Blog / Homepage 的地址,我将非常乐于访问
(选填) Email
Email地址将在经过防SPAM处理后显示在页面。如果您不希望公开自己的Email,请略过此栏
并写下您的见解:
(由于需要进行SPAM过滤,如果评论提交速度慢请耐心等待)
记住我?

  如何进行评论                   当有新回复时给我发送邮件通知
除了 <b> 和 <i> 之外,其他的HTML标签都将从您的评论中去除. URL 或 Email 地址会被自动加上链接.
当您点击发表或者预览之后,系统会自动保存您此次评论的内容,以便当网络原因发表失败时直接按Ctrl-V重新粘贴上次评论内容。
注意:快捷键及自动拷贝功能仅对IE浏览器有效。
发贴统计

Tot 610/1314

日志存档
2008年
2007年
2006年
本 Blog 原创内容
遵循以下授权:

Creative Commons
(创作共用) CC

署名-非商业性
-相同方式分享
Zeal Blog 基于
Powered byPivot - 1.24.1: 'Arcee'
Pivot1.24.1
开发
Launched @
2005-04-27
 里,居也。——《说文》    里,邑也。——《尔雅》。李注:“居之邑也。”沪ICP备05024379号 Back To Home All Links Loading