本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

报码:清华马少平教授详解:人工智能能做什么?(5)

时间:2017-08-06 01:11来源:118图库 作者:j2开奖直播 点击:
同时在蒙特卡洛树搜索中,采用了一种叫做“信心上限”的决策方法,也就是“多臂老虎机”决策问题。每个老虎机有一定的概率赢钱,多个老虎机,不同

同时在蒙特卡洛树搜索中,采用了一种叫做“信心上限”的决策方法,也就是“多臂老虎机”决策问题。每个老虎机有一定的概率赢钱,多个老虎机,不同的老虎机赢钱的概率不一样。所以我可以站在旁边先看别人玩,先找到赢钱概率最大的决策方法。在模拟选择分支的时候,就把每一条路径看做一个老虎机。这之后选择最优路径然后继续随机模拟。模拟一轮后可能有胜有负,看胜率多少,然后把胜率最高的步骤传回。

报码:清华马少平教授详解:人工智能能做什么?

应用了这种方式,计算机围棋可以说是从原来基本不会下棋的状态进到了业余五、六段的水平。谷歌的AlphaGo是怎么解决接下来的问题的呢?单纯是原来蒙特卡洛树的随机模拟是效率很低的。所以谷歌就把深度学习的技术引入进来用于解决搜索量大的问题。在AlphaGo中,采用策略网络减少了模拟的宽度,采用估值网络减少了模拟的深度,在整个模拟阶段不一定从头模拟到尾,这样的话可以提高模拟的效率。实际上围棋就不是靠知识了,是完全靠数据去定义了,通过人类的16万棋谱和AlphaGo自己和自己下的三千多万盘棋,再加上深度学习,就定义了下得好不好这件事。并且在算法中结合了蒙特卡洛树、深度学习等技术,把算法本身的效率提高。

报码:清华马少平教授详解:人工智能能做什么?

5. 汉字识别

再举一个我自己做的汉字识别的例子,20多年前,九十年代的时候,当时我们做的汉字识别属于脱机汉字识别,也就是把汉字写在纸上然后扫描出来识别。联机汉字识别,比如直接在手机上写字识别相对比较简单,因为可以记录笔画顺序。但是脱机的识别就比较难了。当时我们需要把《四库全书》做成成电子版。

报码:清华马少平教授详解:人工智能能做什么?

这个《四库全书》是当年三千多人一起抄写了十年才完成的。现存的完整版分别保存在国图和台北。但是要查询《四库全书》的内容就非常难了,当时台湾出版过影印版,整体缩小四分之一,最后一套书的重量有两吨半。因此很多人想出版成电子版。90年代的时候很多公司抢着想做这件事情。甚至还有公司在人民大会堂抢先开了新闻发布会,当然他们最后也没做成。这些人都想找人采用人工录入的方式,但是都没有成功。

报码:清华马少平教授详解:人工智能能做什么?

后来我们采用了一种“滚雪球”的算法让机器学习前面人工录入的内容,然后慢慢识别后续的文字。在识别的技术上我们用了模糊文字方向线素特征。这个描述的方法是把每个汉字归一化之后,然后变成网络,每一个网格里面统计字的边缘的像素,抽取不同方向的像素特征。一个汉字就是256个特征。

报码:清华马少平教授详解:人工智能能做什么?

我们当时的正确率能够达到95%,后来再通过人工的一些方法,把错误率下降到了万分之一的水平。这里我们等于做的也是一个对于汉字的描述。我们在做这些项目的时候,首要就是要想办法把问题说清楚、给出它的定义。

四、如何指导科研工作

上面分享了一些行业中的成功实践,这些实践如何知道我们的科研工作。要让机器理解人类希望他们处理的“问题”,还是要回到如何把问题说清楚,给出问题的“定义”。

报码:清华马少平教授详解:人工智能能做什么?

下面我结合自己的三个例子说一下。比如我们曾经做过一个垃圾网页识别的项目。

报码:清华马少平教授详解:人工智能能做什么?

1. 垃圾网页识别

报码:清华马少平教授详解:人工智能能做什么?

垃圾网页指的就是通过欺骗搜索引擎,用户搜索的时候,即使是搜的与这个垃圾网页没有关系的词,它也会通过欺骗搜索引擎,把自己的网页排到前面去。非常影响用户体验。

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容