神奇的百度,不遵守 robots.txt 吗?明明已经 Disallow 的链接,还给提示 404 错误。
标签: 百度
百度云盘还真是不错啊
新年新气象:被百度拉黑了
上午到处拜年,现在终于可以休息一下。突然发现百度上搜索水景一页就没有本站的结果了。原来到了新年,木有人值班,直接拉黑了事,免得制造出什么不和谐声音。百度如此反反复复虽然不能全怪它,可是……谁爱用谁用吧,反正我绝大多数时候都用的是 Google。
[转]百度联盟中站长一个不可忽视的问题
[转]从帐号被封来看谷歌百度的差别
一位网友写了篇文章谈了谈 Google Adsense 和百度联盟对有恶意点击广告嫌疑的帐户的不同处理方式,非常有借鉴意义。但是原文出处已不可考,或是我考究得还不够深吧。现转发如下。
继续阅读全文
robots.txt 也挡不住百度收录带 replytocom 的链接啊
之前发现百度并没有严格遵守 noindex nofollow 规则,收录了一些链接中带 replytocom 参数的页面。随后就在 robots.txt 中加入规则,禁止任何爬虫访问带 replytocom 参数的地址。已经在 Google Webmaster 中测试该规则有效。可是今天发现在更新 robots.txt 之后发表的文章 Matching Game ppt 制作还是被百度收录了带 replytocom 的链接。
百度收录的变化真奇特
前天使用 site 查询的时候,发现突然从 1360 条变成了只有 39 条,但是首页收录日期从半个月前(9月7日)变成了前一天。然后昨天变成 36 条,首页仍然是前一天。再到今天上午是 37 条,下午就变成了 1350 条,可是首页收录日期又变成了 9月7日。
水景一页@360搜索之比百度
这几天发现通过 360 搜索来水景一页的访问量渐渐超过从百度过来的了,真是神奇。而且 360 对水景一页的收录量比百度的收录量还少一点儿呢。
百度分享的域名管理好神奇啊
添加了百度分享按钮,看到有数据分析,点进去看看却找不到任何统计信息。再看域名管理,空空如也,然后还怎么都找不到增加域名的地方。搞了半天之后,贴吧里管理员说,需要先用账号登陆百度分享官方网站,再打开自己网站上有分享代码的任意网页,进行一次分享。这么一搞还真的有分析数据了,而且以前的数据也在。
貌似从百度的疯狂调整中幸存了
上周 site 查询百度收录 cnzhx.net 的情况,突然一下子降到了不足 200 条结果;昨天终于恢复到了大约 1500 条。正在莫名其妙之际,听说是因为百度大调整。既然放出的索引基本恢复,看来是从这次大调整中幸存了。