人工智能时代,搜索背后的技术也发生了一些变化,搜索结果不再是匹配,而是走到了理解的角度。搜狗的理解是从符号主义过渡到连接主义——以前把词和词之间定义为高维空间向量的相互独立的向量,通过这种分布式的表达,需要把它放到一个相对低维的、但是连续的向量中。在词理解的基础上,利用CNN、RNN这种目前比较流行的网络结构,对句子、篇章的结构进行建模,对整个比较大的单元理解。有了前面这些理解,在搜索场景下,搜狗可以把用户的查询、用户的问题,把网页文档的信息都用DNN、CNN、RNN这种网络结构去表征,最终通过用户已经在搜索引擎上发生的行为,在大量的海量的监督数据里面,进行批量的监督学习。 在演讲的最后,许静芳这样总结到:“搜索引擎天生就是用来满足人的好奇心和求知欲的,在今天人工智能的时代里,我们希望在之前的基础之上,做到语义的理解与知识体系的构建,开奖,最终达到让搜索引擎成为人类的朋友——有问题,就直接用自然语言跟它交流,它能直接给你回答。” (责任编辑:本港台直播) |