yahoo 收录文档数目更新

yahoo宣告它收录的网络文档数量达到200多亿,其中192亿是网页。


下面是对yahoo、google、yisou和baidu的一些简单比较,目的在于为我自己选择搜索引擎提供依据。


-------------------------
the 查询。


google是35亿多。


yahoo是109亿。搞不懂都去那里捡的?


msn是22亿多。


------------------------
的 查询


yahoo结果28.2亿。如果限定在中文范围,结果是25亿。


google拒绝在所有语言中搜索,限定在中文范围内的结果是2300多万。


yisou的结果是2.1亿。一搜第一页的结果很耐人寻味。


百度的结果很有趣,刚好1亿。好多零。


msn的结果1513万多。


---------------------------


folksonomy 查询。


yahoo,中文范围内的结果是9220,所有语言下的结果是57万3。


google,中文范围内是973,所有语言下是44万4。


yisou,所有语言下45万多,中文下是2583,但是仍然夹杂着好些英文页面/站。


baidu,6750。


msn,24087。msn有点变态,设定范围在中文后的结果是72177???


----------------------------


刻录事这个站点的收录情况:


站内搜索字。


yahoo结果318。(可能是我把yahoo的爬虫挡在了门外)


google结果7770。


yisou让人抓狂,就2条。


baidu,8730。


msn,10。


(对比,cnblog.org内搜索的字)


yahoo,18000。


google,89400。


yisou,8260。


baidu,14800。


msn,148。



站内搜索刻录事三个字。


yahoo,59。


google,975。


baidu,18800,有些变态??


msn,2项。


yisou,2项。


---------------------


msn基本不用考虑。


中文环境下,google、yahoo、baidu可以并立。


对yahoo爬虫开放,希望他不要吃掉我太多流量。