本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

报码:【j2开奖】特写 | 现实版《降临》背后的故事:机器破译古文能否找回逝去的人类文明?(2)

时间:2017-02-01 15:42来源:118论坛 作者:118开奖 点击:
在过去,大部分相关工作都是手工完成的。对于 Linear B 而言,细心构建的语音图最终带来了语言的解密。类似的方法也在古印度语上被尝试过。在20世纪

  在过去,大部分相关工作都是手工完成的。对于 Linear B 而言,细心构建的语音图最终带来了语言的解密。类似的方法也在古印度语上被尝试过。在20世纪30年代,学者 G.R. Hunter 发明了符号集群使他能够发掘隐藏在语句中的一些结构。但他也没能弄清语言的含义。

  印度孟买她他基础科学研究所天文和天体物理部的研究员 Nisha Yadav 表示:「很多原因导致这个语言非常难被破译。首先,文章的句子很短。平均来说,一个印章上总共只有五个符号,被发掘出最长的也只有17个。这么短的文字使得解读文字结构变得十分困难。」

  「这个问题的复杂之处在于,我们不清楚它底层的语言是什么。」美国国家科学基金会感觉运动神经工程中心主任、华盛顿大学计算机科学与工程系教授Rajesh Rao说。

  「我们甚至不知道当时在那个地区,人们所说语言的语言家族。」一旦一个文明消亡,它的文化及书写系统也会逐步消失。「我们没有任何连续的文化传统,」Yadav 说。考古学家还未(在古印度语中)找到某种像 Rosetta 石——破译埃及象形文字的关键所在——一样的多语言文本。

  尽管我们对古印度知之甚少,但这绝不是因为缺乏尝试。「它通常被叫做最难解读的语言因为它有靠近100种解读方式。」威尔斯说,「不过当然,没有人喜欢其中的任何一个。」许多人声称已经破解了语言,它们通常认为该语言是后来语言的某种前身,但没有一个解读方式是成立的。「我觉得最古怪的一种解读,来自于一位佛教大师,他声称通过冥想接触到了创造语言的超自然存在,被告知这些语句代表着什么。」威尔斯补充道。

  

报码:【j2开奖】特写 | 现实版《降临》背后的故事:机器破译古文能否找回逝去的人类文明?

带有驼背牛的滑石印章,印度河流域,Mohenjo-Daro,公元前2500年~2000年。

为破译古印度的语言,最重要的是确定我们看的究竟是什么东西——或是代表语言的某种符号,或是只是代表家族名或神祇名的某些图腾或是会长。「基于我们现有的信息,我们并不能对文字代表的内容作出确切的评断。」Yadav 说。「我认为我们所做的仅仅是尝试拼凑我们现有的一些线索,来看看它们能否印象我们猜测的内容。」Rao 说道,「同时,至少从我们已做的工作来看,我认为它似乎更倾向于靠近我们关于语言的假设。」大多数学者都倾向于同意这一观点。

  2009年,Rao 发表了一篇文论,它研究了古印度文的顺序结构,即特定符号跟在其他符号之前或之前的可能情况。在大多数语言系统中,词或符号以半可预测的方式彼此连接。它们有一定的陈述句结构,但也有相当大的灵活性。研究人员将这种半可预测性称为「条件熵」(conditional entropy)。Rao 和他的同事计算了一个符号按照特定顺序跟随另一个符号的可能性。 「我们感兴趣的是,如果我们可以推测出一些统计规律或结构,」Rao 说,「他能基本上排除这些符号只是简单并置、而有一些规则或模式的可能性。」

  他们将古印度语的条件熵与已知的语言系统(如吠陀梵语)及已知的非语言系统(如人类 DNA 序列)进行了比较,发现古印度语与语言系统非常相似。 「所以,尽管它不能证明这些符号编了一种语言,但它能提供额外的证据证明这些符号不是任意符号的随机并置。」Rao 说,「他们遵循的模式与在能构成语言的符号中能找到的模式是一致的。」

在随后的一篇论文中,Rao 和他的同事对所有的已知的古印度符号进行了研究,观察他们在他们被发现的铭文中的位置。这种被称为马尔可夫模型的统计技术,能够找出具体的信息——如哪些符号是最可能开始一个文本、哪些最可能结束一个文本、哪些符号可能重复,哪些符号经常配对在一起及哪些符号倾向于在特定符号之前或之后等。在处理不完整的铭文时,马尔可夫模型也是很有用。许多文物被发现时已经损坏,部分铭文缺失或不可读,但马尔科夫模型可以帮助填补这些空缺部分。「你可以基于其他完整序列上的统计学信息,来试图填补这些缺失的符号。」Rao 解释道。

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容