Warner说,2016年2月,Google开始展示CelebrityNetWorth数据库中25000位名人的精选摘要。他之所以知道是因为他故意在数据库里面添加了几位假名人(他的朋友)的资料,为的就是想看看这些人会不会被Google当作精选回答弹出来,结果真的是这样。 Warner说:“我们的流量马上急转直下。2017年1月跟2016年1月(当时整个月他们的内容还没有被剽窃)的流量相比,我们的流量下降了65%。”Warner说自己被迫裁掉了1半员工。(在被询问到这种损害自身最好信息来源的举动是否搬起石头砸自己的脚时,Google拒绝发表评论)。 Celebrity Net Worth用了Google的广告网络,于是他试着通过那一块的联系方式接触Google。最后并不走运。当他意识到Google很多的精选摘要并没有把CelebrityNetWorth的名字放上去时,他沮丧的心情遭到了双重打击。很多链接跑到了其他网站,比如房屋抵押网站Bankrate.com,可笑的是甚至那些网站也把CelebrityNetWorth作为自己的来源。
搜索“梅威瑟身价”直接从Bankrate.com提取出来的答案,而这个答案Bankrate.com其实是援引另一来源的。 Warner承认,如果网站搜索流量太过倚重Google,而它的研究成果轻易就能被转化为数字的话,搭建这样的网站是有风险的。但他仍然认为Google的做法是不公平的。他说:“如果精选摘要还留下不走,没关系。我对此已经不再计较。但我百分之一百认为我们对此应该是有功劳的。” Google决定小企业成败的能力显而易见。之前其实也发生过类似的事情,去年该搜索引擎添加了“当地企业名片(Local Business Cards)”,这个东西基本上就是高亮显示地区企业的搜索结果。其结果是,致力于让自己的网站在Google排名靠前的当地企业突然被更新更频繁的网站挤到了一边。2011年Google+的推出也对小型企业有类似的效应,毁灭性的Panda更新也是这样,这项升级本来是想打击垃圾内容网站的,可最后把小型网站的一切都搞砸了。 Google推进直接答案的后果远不止是依赖搜索流量的小型企业主受影响。Google2014年发给Warner的电子邮件让我们稍微了解了一点Google挑选可信来源的办法是什么样的。Google自己当然不会回答这个问题,但基于这封电子邮件,Google的内容审查应该是相当薄弱的,相对于数据是否正确,Google似乎对数据是否机器可达更感兴趣。而精选摘要(利用算法从web挑选出来的答案)的门槛甚至还要更低,因为看起来任何在搜索结果中排名足够靠前的网站都足以充当Google标准答案的来源。所以你才会搜到一大堆结果说奥巴马正在组织一场政变,或者说地球是平的,或者女人是邪恶的,或者这位艺术家发明了电子邮件。 还应该引起注意的是,知识图谱和精选摘要的答案所提供的文字也会被Google的语音助理和Google Home大声宣读出来——他们迫不及待推出显然带有瑕疵的功能的动机很大一部分就因为此。 截止到写稿时,“Larry David的身价”以及“Larry David值多少钱”的查询返回的都是9亿美元,但来源都是Business Insider。Business Insider的故事说“据估计”Larry David身家有9亿美元以上,并且链接到了财富市场洞察机构Wealth-X的一份新闻公告。然后再引用了CelebrityNetWorth稍低一点的4亿美元,并且引用Larry David在跟Charlie Rose对话时的说法,当时他说自己身家连5亿美元都不到。
2017年4月17日Google搜索“Larry David净值”的结果,这个结果似乎出自Google编撰的知识图谱数据库。 这个数字远谈不上决定性,但Google似乎愿意为此背书——不管是Google自己编撰的知识图谱还是不那么严谨的从web抓取答案的精选摘要都是这样(精选摘要通常附带有“关于本结果”的说明,而知识图谱的回答就没有)。
2017年4月17日搜索“Larry David值多少钱?”的结果,上面显示了自动从web抓取的精选摘要。 Google的答案总是在变,有时候会有改善,但并不总是这样,而且Google也没有具体说明过自己是如何处理用户通过知识图谱和精选摘要内置的“反馈”表格提交的评论的。 关于本文Google进行了如下的回应: (责任编辑:本港台直播) |