新年新气象:被百度拉黑了

上午到处拜年,现在终于可以休息一下。突然发现百度上搜索水景一页就没有本站的结果了。原来到了新年,木有人值班,直接拉黑了事,免得制造出什么不和谐声音。百度如此反反复复虽然不能全怪它,可是……谁爱用谁用吧,反正我绝大多数时候都用的是 Google。

robots.txt 也挡不住百度收录带 replytocom 的链接啊

之前发现百度并没有严格遵守 noindex nofollow 规则,收录了一些链接中带 replytocom 参数的页面。随后就在 robots.txt 中加入规则,禁止任何爬虫访问带 replytocom 参数的地址。已经在 Google Webmaster 中测试该规则有效。可是今天发现在更新 robots.txt 之后发表的文章 Matching Game ppt 制作还是被百度收录了带 replytocom 的链接。

robots.txt 也挡不住百度收录带 replytocom 的链接

robots.txt 也挡不住百度收录带 replytocom 的链接

百度收录的变化真奇特

前天使用 site 查询的时候,发现突然从 1360 条变成了只有 39 条,但是首页收录日期从半个月前(9月7日)变成了前一天。然后昨天变成 36 条,首页仍然是前一天。再到今天上午是 37 条,下午就变成了 1350 条,可是首页收录日期又变成了 9月7日。

百度分享的域名管理好神奇啊

添加了百度分享按钮,看到有数据分析,点进去看看却找不到任何统计信息。再看域名管理,空空如也,然后还怎么都找不到增加域名的地方。搞了半天之后,贴吧里管理员说,需要先用账号登陆百度分享官方网站,再打开自己网站上有分享代码的任意网页,进行一次分享。这么一搞还真的有分析数据了,而且以前的数据也在。