编者按:Google 图书是 Google 的第一个“登月”项目(Moonshot),但15年过去了,这个项目还没有“发射”。而之后的其他“登月项目”如无人驾驶汽车、Google Glass、平流层网络气球等都引起了人们的广泛关注。本文探索了我们所不太清楚的 Google 图书计划。 书可以做任何事情。书可以劈开我们内心的冰山。 你知道这句话出自于哪位作者的哪本书吗?如果单纯凭借人的记忆力的话,很难做出回答,直播,有人会想到去 Google 浏览器进行搜索,虽然 Google 提供了一些引用此句的网址链接,但通常这些链接都不可靠。为了得到这个问题的准确答案,你可以使用 Google 图书搜索,它能搜索出数百万数字化的文本。 使用Google 图书搜索之后,你会发现,“书可以劈开我们内心的冰山。”这句话出自卡夫卡在1904年1月写给奥斯卡·波拉克的一封信“给朋友、家庭和编辑的信件”。 Google 图书搜索的计划非常惊人。15年前,它是一个野心勃勃的项目:要把其搜索范围扩张到线下世界。 Google 与一些图书馆合作,扫描数百万本印刷书籍,想把所有线下书籍都导入其数据库。 Google 联合创始人Sergey Brin 表示,“人类知识有数千年,可能最精湛的知识都被藏在书中。如果 Google 没有这个,就太遗憾了。” 今天, Google 以其“登月”文化而闻名,接受世界性的巨大挑战。 Google 图书是很多老资历的 Google 员工共同经历过的,公司的第一个“登月”项目。扫描所有书籍! Google 早期时候有一个“乌托邦图书馆”的愿景,将在线信息搜索这种便利延伸到线下。在当时看来这个计划就像是图书世界的一个奇点: Google 会将所有书籍传到线上,以某种方式产生人类意识的相位变化。实际上, Google 图书已经进入到计划中期,把2500多万的文字片段传送到了它的数据库中。 Google 仍然在坚持他们的初衷,当然除了这些,这里还寄托了其他人的希望。 然而, Google 图书的美好愿景被打破了。这个项目发布后不久,很快遇到了法律问题,作者们抗议 Google 侵犯他们的版权,出版商同样抗议以保护其行业免受侵害。随之而来的是数十年的法律战场,而这场纠纷终于在去年有了了结,美国最高法院驳回了作者协会的呼吁,长久以来笼罩在 Google 头顶的乌云终于散去。 这最终还是改变了 Google 图书的计划,对于陷入法律纠纷数十年的 Google 和 Google 图书的项目员工来说,他们失去了动力和野心。 在研究这个故事时,我曾担心 Google 是否已经放弃这个项目。 Google 图书一直有些秘密没有解开,很像 Google 其他的项目作风。但当我开始提问时,大家闭口不言,几个星期以来,似乎没有任何人可以谈论 Google 图书目前的情况。 Google 图书的“历史”页面在2007年关掉了,其博客也在2012年停止更新,之后 Google 图书又被放到主要的 Google 搜索博客,其中有关图书的信息几乎找不到。 Google 图书是一项很有意义的服务并持续得到外界关注。但作为一个还在进行中的项目,几乎没有任何信息被公布出来,就如同消失了一样。况且 Google 图书的法律纠纷还胜出了,所有这一切都显得匪夷所思。 我向几个已经离开 Google 的校友了解时,有几个人提到他们怀疑 Google 是否已经停止扫描书籍。最后,我了解到,确实还有一些 Google 员工在图书搜索这个项目里工作,而且还在增加新书,虽然此时增加新书的速度已赶不上2010-2011年的时候了。 Google 工程师Stephane Jaskiewicz表示:“我们的重心不在直接面向用户的界面和功能,这更像幕后工作,完善技术。通过获取内容并进行适当地处理,我们可以在线查看整本书,然后调整搜索算法。” 贯穿 Google 图书的一个工作重点,是不断改进扫描新书的扫描仪。2002年,项目刚开始时,拉里·佩奇和玛丽莎·梅耶尔估算扫描所有书籍可能需要多长时间,他们在台架上设置了一台数码相机,并使用节拍器进行定时。当公司开始认真对待这个项目时,要提高扫描的效率,对每一个操作细节都非常讲究。 Jaskiewicz说扫描仪确实不停地在更新,新版本每六个月推出一次。在项目启动时,LED照明灯不够多,因此大家要研究技术让人类操作者更有效地翻页。 “这几乎就像在弹奏吉他。”Jaskiewicz说。 “所以我们需要找到很会翻页的人。” 不过, Google 图书的大部分工作仍然是要确保搜索的质量,确保用户能快速找到所需的图书内容,这其实是个枯燥的游戏,不像是在“登月”,更像是在维修卫星。 (责任编辑:本港台直播) |