刘浩贤认为这个答案在当时看来不怎么完美,但好在他的策划案并未因此被草草否决。更令他感到高兴的是,牛津高阶 App在上线两个月后的销售额就让出版社收回了开发成本,并在一次打折季营销活动里,登入了香港地区苹果商店软件销售总榜的第 7 名。
牛津高阶英汉双解词典 App (第 8 版)。 图片来自: Apple Store 刘浩贤把这次成功归结于一个“顺应时代发展的做法”,另外,牛津辞典在此之前树立的良好口碑,使其得到了许多教育机构和专业出版社的推荐。 牛津高阶英汉双解词典 App 与现在人人爱用的在线词典软件其实并不相同,尽管二者都接入了专业辞典出版社的语料库。就拿网易旗下的有道词典来说,它的词库里包括了柯林斯英汉双解大辞典、21 世纪大英汉辞典,甚至于维基百科上的内容。当你查询一个词时,可以得到来自于这些数据库不同的解释,以及搜索引擎提供的英语例句。 相较于此,传统词典出版社所建立的语料库所能提供的释义范围则要因此受到一定局限。 首先,App 里内容全部来自于牛津英语辞典的语料库。而语料库的标签结构,决定了 App 的所能够提供的查词功能和释义范围。编辑人员和工程师在制作辞典内容时,则很大成程度上受到语料库中每条信息标签的限制。 相比于 John Simpson 在上世纪 90 年代刚刚电子化的数据库,刘浩贤反复提到的这个 OED 语料库 (corpus) 已经是一个经过编辑和工程师不断完善、收集了数十亿字词的巨型数据库。它从不同媒体收集语料,包括报章、杂志、文学、电台录音、戏剧对白等。每个语料的出处,包括时间、地点、来源都有纪录。编辑通过分析语料库的内容来编写词条──按使用频率、出现时间、国际流动性等来决定是否收录某个词,并分析撰写词义。例证也是从语料库选出,保证是真实的使用纪录。编辑们一般会倾向于选择组织严谨、在语法上富象征意义的语料。 事实上,不论是辞典、电子辞典、内容授权,都是在这个语料库支持下的前端的产品。它曾是 Murray 的一间小书阁,现在,语料库让我们快速地在外国旅行时,用几秒钟便看得懂眼前菜单上的菜名。 同样在语料库的支持下,除了传统意义上的辞典开发,牛津大学出版社的内容授权对象范围很广——包括和苹果、谷歌、腾讯这样的科技公司进行内容上的合作。 “除此之外,我们还在建立一个针对收录不同语言的学术项目。”刘浩贤最后提到:“我们现在在谈的都是汉语和英语词典,但牛津还在不同国家不同地区有其他的辞典项目。我们还在计划做一个多语种的大型数据库。在未来,它不光能够产出辞典、电子辞典、翻译软件,它也将会是牛津大学出版社做一个语言保护计划的一部分。我们的目标是收纳一百种不同的语言。” 题图来自:Examining the OED
TED 也谈人和机器的冲突,都在谈些什么? | TED 2017 现场报道
LVMH 将以 65 亿欧元收购 Dior,这个 70 岁的品牌到底卖的是什么?
拥有1.3万家门店,12个女鞋品牌的百丽集团可能要贱卖,为什么百货一楼的老牌女鞋不行了? (责任编辑:本港台直播) |