端点SEO博客

系统化学习SEO技术,实时关注业界动态

内容页面发布时间错乱可导致不被收录

在第一期【院长帮帮忙】栏目露面的站点是编织汇(www.bianzhihui.com),该站点通过反馈中心反馈页面内容迟迟不被抓取,经百度工程师追查,原来是因为页面上的无用时间信息——没有想到是不是?同学们快来看看这个案例吧。

站点求助:现象
  编织汇网站内容发布后几个礼拜都未曾收录。案例如下:
  http://www.bianzhihui.com/t/6717(教程详细页面举例)
  http://www.bianzhihui.com/u/12306 (用户页面举例)
  http://www.bianzhihui.com/h/154 (编织花样页面举例)
  我们已将这些url放入sitemap,并使用了百度统计的集成的JS推荐,但是未曾有改善。

站点求助:自查
  根据反馈中心的回复,使用抓取异常工具诊断:未发现异常

院长出手,内部追查
  工程师结论: spider抓取很及时,但因为该网站没有设置内容产出时间,网站底部却有个老旧时间日期,导致spider误以为网页内容老旧(具体策略较复杂,在此不做赘述)。建议增加页面内容产生时间,去掉没有必要的时间信息

内容页面发布时间错乱可导致不被收录
*以上为旧页面截图,“2014年9月9日”对时间识别造成干扰。

给我们的启发:

  1. 网页上切忌勿乱加时间,如我们网站的(始于2014年9月9日)这种时间是一个大忌
  2. 网页内容尽可能加上产出时间,也就是发布时间
  3. 百度site的结果时间和权重并无太多关系
  4. 跟百度沟通的时候,一定要条例清晰,证据确凿。自身的问题一定要先排查准确。

来源:百度站长平台

除非注明,文章均由©端点SEO博客原创
转载请保留本文链接:http://www.iseoduan.com/seoanli/563.html
最后更新: 2016年11月26日 — 17:33
©2015~2017 | 端点SEO博客:揭露SEO本质,提供SEO培训,系统的学习SEO优化 备案号:京ICP备12011610号-3 站点地图|端点SEO博客