验证码: 看不清楚,换一张 查询 注册会员,免验证
  • {{ basic.site_slogan }}
  • 打开微信扫一扫,
    您还可以在这里找到我们哟

    关注我们

百度sitemap网站地图协议规范及常见问题有哪些

阅读:1070 来源:乙速云 作者:代码code

百度sitemap网站地图协议规范及常见问题有哪些

      Sitemap(站点地图)是一种文件的统称,通常Sitemap(站点地图)可以是txt或者XML格式。通过Sitemap(站点地图)你可以告诉搜索引擎关于你的站点中的网页、视频或者其他文件的相关信息,帮助搜索引擎更好的认识和理解你的站点。格式正确的Sitemap(站点地图)文件会帮助搜索引擎更高效地抓取你的网站。

      百度Sitemap说明

      文件地址格式为txt或xml,每个地址文件最多包含50,000个网址且需小于10MB。

      sitemap提交工具仅对已验证站点开放使用,开发者无法提交同一主域下其他未验证站点的数据。

      请勿提交索引型sitemap,索引型不予处理,且若存在索引型sitemap,将不允许提交新文件;请删除索引型sitemap后再尝试提交数据。

      txt文本格式

      在一个txt文本列明需要向百度提交的链接地址,将txt文本文件通过站长平台进行提交

      需要遵循以下指南:

      文本文件每行都必须有一个网址。网址中不能有换行。

      不应包含网址列表以外的任何信息。

      您必须书写完整的网址,包括 http。

      每个文本文件最多可包含 50,000 个网址,并且应小于10MB(10,485,760字节)。如果网站所包含的网址超过 50,000 个,则可将列表分割成多个文本文件,然后分别添加每个文件。

      文本文件需使用 UTF-8 编码或GBK编码。

      xml格式

      xml格式提供有关您网站的其他信息,如上次更新日期、Sitemap文件的更新频率等,供百度Spider参考。

      标签名称标签说明标签类型标签限制可选/必选举例






      urlset




      urlurl标记每条信息的开始和结束//可选 
      最多出现50000次







      url




      loc该条数据的存放地址任意URL最小长度1个字符
      最大长度256个字符
      符合正则表达式(http://)(.+)
      必选http://www.baidu.com/
      lastmod指该条数据的最新一次更新时间日期或日期时间格式为:YYYY-MM-DD[Thh:mm:ss],日期与时间之间使用T分隔,可以仅提供年月日部分可选2013-01-01
      changefreq指该条数据的更新频率字符串有效值为:always、hourly、daily、weekly、monthly、yearly、never可选always
      priority用来指定此链接相对于其他链接的优先权比值,此值定于0.0-1.0之间小数大于等于0.0
      小于等于1.0
      可选1.0

      XML格式举例

      
      
      
          
          
              http://www.baidu.com/
              
              2013-01-01
              
              always
              
              1.0
              
          
      

      若有多条url,按照上述格式重复之间的片断,列明所有url地址,打包到一个xml文件,向站长平台进行提交。

      如何提交Sitemap

      第一步,将需提交的网页列表制作成一个Sitemap文件,文件格式请阅读百度Sitemap协议都支持哪些格式。

      第二步,将Sitemap文件放置在网站目录下。比如您的网站为example.com,您已制作了一个sitemap_example.xml的Sitemap文件,将sitemap_example.xml上传至网站根目录即example.com/sitemap_example.xml

      第三步,登录百度站长平台,确保提交Sitemap数据的网站已验证归属。

      第四步,进入Sitemap工具,点击“添加新数据”,文件类型选择“URL列表”,填写抓取周期和Sitemap文件地址

      最后,提交完之后,可在Sitemap列表里看到提交的Sitemap文件,如果Sitemap文件里面有新的网站链接,可以选择文件后,点击更新所选,即对更新的网站链接进行了提交。

      Sitemap常见问题

      填写的周期是什么含义?

      百度Spider会参考设置周期抓取Sitemap文件,因此请根据Sitemap文件内容的更新(比如增加新url)来设置。请注意若url不变而仅是url对应的页面内容更新(比如论坛帖子页有新回复内容),不在此更新范围内。Sitemap工具不能解决页面更新问题。

      Sitemap提交后,多久能被百度处理?

      Sitemap数据提交后,一般在1小时内百度会开始处理。在以后的调度抓取中,如果您的sitemap支持etag,我们会更频繁抓取sitemap文件,从而及时发现内容更新;否则抓取的周期会比较长。

      提交的Sitemap都会被百度抓取并收录吗?

      百度对已提交的数据,不保证一定会抓取及收录所有网址。是否收录与页面质量相关。

      我可以压缩我的 Sitemap 吗?它们是否需要用 gzip 压缩?

      可以。请使用 gzip 压缩 Sitemap。无论压缩与否,Sitemap 应该小于 10MB(10,485,759字节)。

      XML格式的 Sitemap 中,“priority”提示会影响我的网页在搜索结果中的排名吗?

      不会。Sitemap 中的“priority”提示只是说明该网址相对于您自己网站上其他网址的重要性,并不会影响网页在搜索结果中的排名。

      网址在 Sitemap 中的位置是否会影响它的使用?

      不会。网址在 Sitemap 中的位置并不会影响百度对它的识别或使用方式。

      Sitemap中提交的url能否包含中文?

      因为转码问题建议最好不要包含中文。

    分享到:
    *特别声明:以上内容来自于网络收集,著作权属原作者所有,如有侵权,请联系我们: hlamps#outlook.com (#换成@)。
    相关文章
    {{ v.title }}
    {{ v.description||(cleanHtml(v.content)).substr(0,100)+'···' }}
    你可能感兴趣
    推荐阅读 更多>