百度的收录数据很让人莫名其妙

前些天检查水景一页在百度的收录情况,发现其数据非常的让人迷惑。在百度统计后台看到的收录情况更新并不及时,且其数据与使用 site 或 inurl 语法在百度搜索中查询到的结果稍有出入。特别是 site 语法和 inurl 语法查询到的结果出入非常大。并且,搜索用户在搜索相关内容的时候,百度仅仅会展示使用 inurl 语法能够搜索出来的该网站的相关收录条目。

估计是因为水景一页的服务器在国外,所以网站内容在百度上的收录一直不怎么好,波动也很大。现在基本上已经不怎么关注百度如何收录自己的网站了。总觉得百度捉摸不透,也就懒得捉摸了。

百度站长平台已经出来很久了,但是一直处于内测状态,所以无缘尝试。对于百度一直大力推广的百度统计倒是用过一段时间。下图是这一段时间里水景一页在百度统计后台看到的收录情况,波动非常大。

水景一页在百度统计后台显示的收录变化情况

在上图显示的最新日期附近,我同时观察了使用 site 语法和 inurl 语法在百度搜索中检查收录情况。发现他们三者显示的数据都不太一样。

site 语法检索的百度收录水景一页情况

inurl 语法检索的百度收录水景一页情况

可以看出来,使用 inurl 语法检索的结果条目少了很多。而且,使用 inurl 语法检索的时候,结果中还包含了一些自动采集网站所收集的水景一页的介绍,其网址中包含了 cnzhx.net 字样。

另外,根据我的观察,通过百度搜索来访问水景一页的用户,其内容基本上都局限于那些使用 inurl 语法能够检索到的内容。在 site 语法检索结果中有而 inurl 语法检索结果中没有的内容,基本不会带来流量。也就是说,百度虽然在收录网站页面(也并不一定是全部),但是并没有将它们全部展示给搜索用户。但是百度使用什么样的标准来进行这一区分却没有搞清楚,因为从水景一页的收录和访问情况看不出任何规律。

对于这样一个莫名其妙的搜索引擎,我觉得实在没有必要花费心思在上面,所以当即拿掉了百度统计代码。同时还从百度统计帐户中删除了自己的网站记录,其提示很有意思:

百度统计删除提示

其实我很想知道,百度站长平台的表现会不会好一点。不过现在没兴趣了。百度倒处宣传,说什么百度统计后台显示的统计数据才是最准确的,可是事实似乎并不是这样。而且,站长关心收录情况的目的是看看自己网站会不会被百度搜索展示给用户,实际上,就算你看到百度统计将你的网站所有页面,包括归档页面,全部都收录无遗的话,如果 inurl 语法检索不到,搜索用户在搜索结果中也是看不到你网站的条目的。这就有点儿玩弄人的感觉了。©

本文发表于水景一页。永久链接:<http://cnzhx.net/blog/confusing-data-of-baidu-site-analytics/>。转载请保留此信息及相应链接。

4 条关于 “百度的收录数据很让人莫名其妙” 的评论

  1. 引用通告: 百度收录数据疑问之二 « 水景一页

  2. 引用通告: 百度收录水景一页的新情况–还是很让人迷惑 | 水景一页

雁过留声,人过留名

您的电子邮箱地址不会被公开。 必填项已用 * 标注

特别提示:与当前文章主题无关的讨论相关但需要较多讨论求助信息请发布到水景一页讨论区的相应版块,谢谢您的理解与合作!请参考本站互助指南
您可以在评论中使用如下的 HTML 标记来辅助表达: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>