百度首先,附上从feedsky的feed实时访问纪录表,这张表,虽然只能反应在feedsky上的那个feed的流量,但也可以了解一下,原来Baidu爬虫是大概每隔半小时就会来访问我的feed,这可以说明了并不是每天更新,百度就会对你的博客好….

对百度这个搜索引擎,国内的很多独立博客也抓不住他的规律,因为他很多东西是人工干预的,既然是人工的,他想怎么样就怎么样,对此我真的是深有感觉,因为,这个博客在百度中的排名一直不好。

实际上我基本上每天都在更新,而且固定保持在每天一篇,这样,至少不可能会被认为采集站吧?那么,他们每天都是先看到我博客更新的,那么,为什么我的文章不出现的搜索结果中,而人家以后用百度空间抄了我的内容,他们就直接收录了?

百度,难道连原创不原创都不能区分吗?

这几天发现site:poshi.org只有4篇结果了,又被删了很多,再举个例子,我的朋友Tino的博客,他一星期也只更新两三篇,有时候还一个星期都不更新,总之就是很不规律的,可是site:tinoland.cn,都有18篇的结果…

我还是觉得,可能是百度的人就是想怎么样就怎么样,不过,好像可恶的不是爬虫…

最近30次访问

阅读器名称 返回订阅数 地区 时间
inezha.com (在线阅读器) 3 中国,Jinhua 2008-08-14 19:41:45
Baidu (爬虫) - 中国,北京 2008-08-14 19:30:32
Mozzila/1.3 (未知…) - 中国,北京 2008-08-14 19:32:15
Mozilla/5.0 (未知…) - 中国,北京 2008-08-14 19:31:56
IE7 (浏览器) - 中国, 2008-08-14 19:28:48
IE7 (浏览器) - 中国, 2008-08-14 19:26:50
Google (在线阅读器) 25 美国,Mountain View 2008-08-14 19:08:09
inezha.com (在线阅读器) 3 中国,Jinhua 2008-08-14 19:11:42
Baidu (爬虫) - 中国,北京 2008-08-14 18:59:23
Thunderbird (离线阅读器) - 中国,北京 2008-08-14 18:57:52
xianguo (在线阅读器) 62 中国,北京 2008-08-14 18:57:01
Yahoo (爬虫) - 中国, 2008-08-14 18:44:03
Zhuaxia (在线阅读器) 5 中国,Tianjin 2008-08-14 18:39:52
Zhuaxia (在线阅读器) 5 中国,Tianjin 2008-08-14 18:39:52
Zhuaxia (在线阅读器) 28 中国,Tianjin 2008-08-14 18:30:13
Zhuaxia (在线阅读器) 28 中国,Tianjin 2008-08-14 18:30:14
YoDao.com (在线阅读器) 2 中国,北京 2008-08-14 18:27:43
Baidu (爬虫) - 中国,北京 2008-08-14 18:26:06
Baidu (爬虫) - 中国,北京 2008-08-14 18:24:39
Mozzila/1.3 (未知…) - 中国,北京 2008-08-14 18:31:39
inezha.com (在线阅读器) 3 中国,Jinhua 2008-08-14 18:26:38
Jakarta (离线阅读器) - 中国,北京 2008-08-14 18:14:04
Google (在线阅读器) 25 美国,Mountain View 2008-08-14 18:08:05
xianguo (在线阅读器) 5 中国,北京 2008-08-14 18:05:06
xianguo (在线阅读器) 62 中国,北京 2008-08-14 17:56:31
YoDao.com (在线阅读器) 2 中国,北京 2008-08-14 17:56:51
Baidu (爬虫) - 中国,北京 2008-08-14 17:55:44
GreatNews (离线阅读器) - 中国,北京 2008-08-14 17:47:12
Bloglines (在线阅读器) 2 美国,Ashburn 2008-08-14 17:53:19
inezha.com (在线阅读器) 3 中国,Jinhua 2008-08-14 17:41:34
2008/08/14/ 8:20 | 互联网络 | 658 次点阅

原文: feed最近30次访问及可恶的百度爬虫

来源: 新后园

你在新后园上看到的文字,都是Poshi及其朋友所写,属于原创内容,如果你要转载,请保留上面这一行版权声明!