本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

【j2开奖】深度学习在NLP领域成绩斐然,计算语言学家该不该惊慌?(3)

时间:2017-04-18 03:16来源:报码现场 作者:本港台直播 点击:
2. The only mental provision she was making for the evening of life, was the collecting and transcribing all the riddles of every sort that she could meet with. (Jane Austen, Emma, 1816) 3. The diffic

2. The only mental provision she was making for the evening of life, was the collecting and transcribing all the riddles of every sort that she could meet with. (Jane Austen, Emma, 1816)

3. The difficulty is in the getting the gold into Erewhon. (Sam Butler, Erewhon Revisited, 1902)

这通常是在短语结构树形图的层次中通过某种类别的变更操作进行分析,但有证据表明,这个其实是语言中非分类行为的一种情况。

确实,这个解释早期用于 Ross (1972) 的「squish」案例。历时的(Diachronically),V-ing 形式表现出动词化的增长历史,但在许多时期,它表现出非常离散的状态。如我们在这个领域找到的明确评估判断:

4. Tom's winning the election was a big upset.

5. This teasing John all the time has got to stop.

6. There is no marking exams on Fridays.

7. The cessation hostilities was unexpected.

限定词和动词对象的众多组合听起来并不是很好,但还是比通过派生词素(如-ation)名词化对象好多了。Houston (1985, page 320) 表明,V-ing 形式到离散词性分类的分配要比连续型解释在-ing 和-in 的语言交替性差得多(预测意义上)。他还认为「语法类别存在于一个连续统一体,它们在类别之间没有明确的边界。」

我的一个研究生同学 Whitney Tabor 探讨了一个不同而有趣的案例。Tabor (1994) 研究了 kind of 和 sort of 用法的不同,我在 1999 年的教科书(Manning and Schutze 1999)介绍性章节中使用了该案例。名词 kind 或 sort 能构成名词性短语,或者作为副词性修饰语的限制:

8. [That kind [of knife]] isn't used much.

9. We are [kind of] hungry.

有趣的是,歧义性形式存在重新分析的路径,如下面的语料对,它们展示了一种形式是如何从另一种形式出现的。

10. [a [kind [of dense rock]]]

11. [a [[kind of] dense] rock]

Tabor (1994) 讨论了古典英语为什么存在 kind,但极少或根本没有 kind of 的用法。从中世纪英语开始,为再分析提供生长地的歧义语境开始出现(案例 (13) 中的是 1570 年的语句),随后的非歧义案例限制性修饰语出现了(案例(14)是 1830 年的语句):

12. A nette sent in to the see, and of alle kind of fishis gedrynge (Wyclif,1382)

13. Their finest and best, is a kind of course red cloth (True Report,1570)

14. I was kind of provoked at the way you came up (Mass. Spy,1830)

这是一段没有同步性(synchrony)的历史。

读者们,你们留意到了我在第一段中引用的那个例子吗?

15. NLP is kind of like a rabbit in the headlights of the deep learning machine (Neil Lawrence, DL workshop panel, 2015)

Whitney Tabor 使用一个小型的深度循环神经网络(具有两个隐藏层)对这个演化过程进行了建模。他在 1994 年利用与斯坦福的 Dave Rumelhart 一起工作的机会完成了该项研究。

就在最近,开始有一些新的研究工作旨在驾驭用于建模和解释语言差异与变化的分布式表征的力量。事实上,Sagi, Kaufmann, and Clark (2011) 使用了更加传统的研究方法——潜在语义分析(Latent Semantic Analysis)来生成分布式语词表征,展现分布式表征如何能捕捉到某个语义变化:随着时间的推移,被指称的对象范围的扩大和缩小。比如,在古英语(Old English)中,deer 是指任一动物,但在中世纪以及现代英语中,atv,这个单词被用来清楚指称某科动物。dog 和 hound 的意思调了个个儿:在中世纪英语中,hound 被用来指称任何一种犬科动物,但是现在却被用来指称某特定子类,dog 的使用情况正好相反。

现在 NLP 对于机器学习和产业应用问题是如此关键,生活在这样一个时代我们应该感到兴奋和高兴。

  

【j2开奖】深度学习在NLP领域成绩斐然,计算语言学家该不该惊慌?

图 1:cell 与四个其它单词的余弦相似度随时间变化而变化(其中 1.0 表示最大相似度,0.0 表示无相似度)。

Kulkarni et al. (2015) 使用神经词嵌入(neural word embeddings)建模词义的转变,例如,过去一个世纪来 gay 的含义的转变(根据 Google Books Ngrams 语料库)。在一个最近的 ACL 研讨会上,Kim et al. (2014) 采用了一个相似方法——使用 word2vec——查看词义的最近变化。例如,图 1 中,2000 年左右他们表明 cell 的词义如何从接近于 closet 和 dungeon 迅速改变为接近于 phone 和 cordless。在这一语境中一个词的含义是超出词的所有含义的平均值,并通过使用频率加权。

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容