刨根分析:Google 指责错了,Bing 同学可能还真不

最近Google指责Bing抄袭一事炒的火热。Google先是策划好在“搜索之未来”大会前一天爆料,然后Bing第一时间回应说Google是编小说呢,然后Google官方博客向Bing开火,Bing再次不承认,同时还倒打一耙说Google也抄袭我们呢,最后Matt Cutts继续拿出了更多证据,甚至连讽刺电视都插一腿进来。事情已经乱套了,这事到底谁对谁错呢?SEL的主编Danny Sullivan来了个彻底的分析,他认为Google错怪Bing同学了,以下是长篇分析。观看用户不算抄袭:微软不承认抄袭了Google的搜索结果,他们一直都没承认这一点,因为他们没直接看Google同学的考卷,而是利用点击数据流改进搜索结果的,只不过点击数据流的来源有Google。Bing的集团VP Harry Shum也一直坚称:我们并没有抄袭,只是观察用户。Bing的经理Stefan Weitz也说:“复制”这个词有独特的内涵,这么说我们是错误的。我们只是得到了点击数据流,然后进行分析,我们并不一定全用它。点击数据流?Google坚持微软利用了IE浏览器和Bing工具栏监视用户在Google搜索了什么,但Bing不承认他们只监视Google,他们监视的是用户在整个网络上的操作行为。Bing可以看到用户正在浏览什么,假设他们去了百度,Bing也会知道的,假设用户在百度做了搜索,Bing也会知道你搜索了什么点击了什么。其实叫点击数据流不太准确,我们暂且给它一个更准确的名字吧:冲浪数据流。通过冲浪数据流获得搜索活动:人们当然上Google的次数最多,只要他们搜索了什么,Bing就知道,因为只要分析一下他们进入的网页地址就成了:当然Bing也知道用户点击了Google的哪个搜索结果──只需要记录下一个去到的那个网站的地址即可。这样做之后,Bing就知道用户针对某个搜索关键字选择了哪个最适合的搜索结果网站。Bing确实在分析搜索引擎,但并不只针对Google:其实前面已经说了,Bing的这种冲浪数据流的分析并不只针对Google,而是所有网站,即便是在百度搜索,可能也会被Bing所知道。等于说是全天下所有搜索引擎都在帮助Bing提升搜索质量,这是一种很聪明的做法。Bing的Shum也承认这一点:我们会收集所有信息,全部的点击数据流会按照不同信号种类分为不同权重。头搜索(常用词搜索)权重大,长尾搜索(非常用词搜索)权重小。1000种信号种类:Bing号称自己有1000种信号种类,搜索只是其中的一种,而且并没有凌驾于其它信号种类之上。即便是Google的测试也证明了搜索信号权重不高:Bing承认对于那些怪异关键字的搜索,Bing收集到的冲浪数据流会导致其结果与Google的搜索结果相近。Google正是掌握了这个证据才坚称Bing抄袭了。但Bing不这么认为,他们觉得即便是Google的测试也证明了搜索信号权重不高,因为Google测试了100个关键字,只有大概9%导致Bing的搜索结果跟Google一样了。9%确实是个不高的数字,Google方面在爆料的时候也说他们不清楚为什么Bing只有9%的结果上钩了。Bing称就是因为搜索信号这个种类的权重并不高,不会导致自己的搜索结果全盘与Google一样,Google的测试反到成了证明这一点的最好证据。为啥Google发现Bing越来越像自己了?Google的故事里还说道他们不是无缘无故钓Bing上钩的,他们之前已经发现Bing越来越像自己了,非常多的首页搜索结果跟Google一模一样。但Bing也不承认这一点。在去年10月Bing内部使用了全新的算法和称为Aether的实验系统,来测试排名的变化。这个变化让Google感到了冲浪数据流的存在。实际上这是另外一个Google没清楚回答的问题,Google说他们去年5月就发现Bing开始用冲浪数据流了,但为什么直到数个月之后才发现Bing的搜索像自己?Google也不知道,可能是Bing在后来提升了冲浪数据流的权重吧。

本文出自快速备案,转载时请注明出处及相应链接。

本文永久链接: https://kuaisubeian.cc/4713.html

kuaisubeian