Sitemap网站地图标准格式及大小说明

时间:2021-11-23 06:41:20

一、Sitemap格式:

    Sitemap网站地图可以采用如下三种格式的文件向搜索引擎提交,文件编码可以是UTF-8或GBK:

        1)标准的XML格式文件

        2)文本TXT格式文件

        3)Sitemap索引文件(可同时包含多个Sitemap文件)

二、Sitemap大小:

       1)单个Sitemap文件:大小不超过10MB,且包含不超过50000个网址。如果网站所包含的网址超过50,000个,则可将列表分割成多个Sitemap文件,放在Sitemap索引中。

       2)单个Sitemap索引文件:大小不能超过500M,如果超过请提交多个Sitemap索引文件接口。

三、XML格式Sitemap说明

       1) XML格式举例

       

  1. <?xml version="1.0" encoding="utf-8"?> 
  2.  
  3.              <!-- XML文件需以utf-8编码--> 
  4.  
  5.               <urlset> 
  6.  
  7.                 <!--必填--> 
  8.  
  9.                  <url> 
  10.  
  11.                     <!--必填,定义某一个链接的入口,每一条数据必须要用<url>和</url>来标示 --> 
  12.  
  13.                     <loc>http://www.xxxxxx.html/000000.html</loc> 
  14.  
  15.                     <!--必填,URL长度限制在256字节内--> 
  16.  
  17.                     <lastmod>2012-12-01</lastmod> 
  18.  
  19.                     <!--更新时间标签,非必填,用来表示最后更新时间--> 
  20.  
  21.                     <changefreq>daily</changefreq> 
  22.  
  23.                     <!--更新频率标签,非必填,用来告知引擎页面的更新频率 --> 
  24.  
  25.                     <priority>0.8</priority> 
  26.  
  27.                     <!--优先权标签,优先权值0.0-1.0,用来告知引擎该条url的优先级--> 
  28.  
  29.                </url> 
  30.  
  31.            </urlset> 

        2) XML标签说明

标签名称 

属性 

标签说明 

标签类型 

标签限制 

可选/必选 

changefreq 

/

标示数据更新频率 

字符串 

有效值为:always、hourly、daily、weekly、monthly、yearly、never

可选 

lastmod

/

标示数据最新一次更新时间 

日期 

时间格式为yyyy-mm-dd 

可选

loc 

/

标示该条数据的存放地址 

url 

最小长度1个字符
最大长度256个字符
以"http://"开头

必选 

priority

/

标示优先值

小数

[0.0 1.0](大于等于0小于等于1,保留一位小数)例如:< priority >0.8< priority >

可选 

url 

/

url地址的开始和结束

最多出现无限次

必选 

urlset 

/

urlset用来标记整个文档的开头

/

必选 

 总结:Sitemap通常是有效的告诉蜘蛛,方便读懂我们的网站内容,从而加大蜘蛛对我们网站的认可,对此,对于收录问题上升是不容小视。