这段时间关于淘宝封锁百度蜘蛛抓取的事情吵的沸沸扬扬,关于百度C2C即将开始内测等等,大家都在观望着事情发展的趋势.
淘宝为什么会封百度的蜘蛛爬虫呢?为什么不封别家搜索引擎的,只是封百度的呢?因为的就是这个经常性模仿和抄袭别人运营模式的百度马上就要推出自己的C2C了,这个对于淘宝在网上购物的龙头地位受到了威胁,所以封锁百度的爬虫是必须的.但是这个封锁也不彻底,淘宝需要做的是只是让Google,AOL等国际著名搜索引擎的蜘蛛抓取,其他的不知名爬虫都应该严禁入内,百度的马甲爬虫太多仅仅是封锁名为Baiduspider的蜘蛛是无济于事的.
自从腾讯的拍拍网推出之后,就将淘宝的市场分割了一部分,虽然我们都认为淘宝的用户体验上是大大超过了拍拍,但是由于大量的QQ用户使得拍拍网在飞速的发展,现在百度这个中国搜索行业的巨头也想来分一杯羹,淘宝当然是不干了.淘宝长期积累和培养出来的商品管理,商家信息等都是核心竞争力的一部分,不希望被百度抓走,更不希望百度跟着他更新.也不希望百度可以抓到数以万计的及时商品更新,报价,商品描述等等.
百度的C2C目前还没有展现在我们的面前,但是对于无耻的爬虫来说,已经将很多B2B网站的数据分类网站结构等等抓取到手,当百度的C2C推出的时候必然是一个重磅炸弹,会在行业里引起轰动,这个是必然的,我们猜想的是百度C2C的运营也许会参考Froogle的模式,一边开商店,一边对比网络上所以商品的信息,这点也是淘宝所不允许的.Froogle的失败让百度在其中找到了一个比较不错的捞钱门路,在吸引用户开商店的同时,让用户可以通过百度爬虫获得其他网站的数据做出比较,甚至是盗取图片和商品价格描述.这个也是淘宝封锁百度蜘蛛的另一个原因.
百度在国内铺天盖地的广告攻势和口碑相传之后,现在基本上每个人都知道”有问题百度一下”,而淘宝则不希望用户在网上购物时候也出现这样的错觉,淘宝认为买东西第一必须是去淘宝网上搜索,而不是通过百度搜索之后进入淘宝,用户以前的这种行为淘宝很喜欢,百度白白的为淘宝带去了大量的用户,但是百度的人工干预搜索政策在C2C推出之后搜索结果必然是百度C2C在前,淘宝在后.所以淘宝势必要扭转这种局面,即时不封百度的蜘蛛,被百度抓取的内容也是徒然的.
所以说,淘宝封锁百度的蜘蛛是必须的,而且现在封锁的还不彻底,淘宝需要做的就是防范于未然,时刻提防躲在暗中,随时可能放箭的百度,即使你不走正常渠道的使用爬虫抓取,也会偷偷摸摸的用马甲爬虫去偷数据的.
马云如果聪明的话就不应正面迎敌,嫩不是还有一个成为废人的雅虎吗?用他做点文章岂不是更好?
淘宝和百度的战争远远没有结束!!