自动驾驶技术也同样存在大量的问题,例如正常晴好天气,和雨雪等恶劣天气,对解决问题来说难度的差别非常大。各种各样的路况情况,也对自动驾驶的实用化带来很大的挑战。 现有的大量人工智能应用,在实验室条件下很多已经达到了非常好的成绩,但是在工业化应用中,由于使用条件比实验室环境要复杂和恶劣的多,需要处理各种异常和干扰因素,因此很多应用的实际水平,还徘徊在强人类级和弱人类级之间。 目前人工智能的技术,从实验室走向实际应用,需要克服的问题很多,还有很长的路要走。在实际落地的时候,务实的做法是先限制具体的场景,尽量排除掉不确定性因素,简化问题。例如在自动驾驶技术的研发中,如果限制为固定线路之间、或者封闭道路内的应用,技术难度就会大大简化,此时往往就能从弱人类级往上提升1-2个级别,达到实际可用的程度。在文字阅读理解时,如果限制文本的行业、类型和理解内容时,也能大大的提升系统的准确率,达到可以实用化的地步。 当然,从“不确定性”的角度来说,机器也有优势。因为人的精力有限,长时间专注一件工作会导致判断准确度的下降,工作质量无法长时间保持,但机器则没有这个问题。机器在长时间、高压力的工作环境下仍能保持稳定的运行,不会感到“疲劳”,也不会受到情绪的影响。在这种情形下,人工的工作质量反而会出现“不确定性”,而机器的输出却是相对“确定”的。 因素3 积累的训练数据的规模 我们都知道,“大数据+算法模型=人工智能”,由此不难看出,人工智能的关键性的基础是大数据。俗话说,巧妇难为无米之炊,只有积累了海量的训练数据,才能将人工智能的水平向上提升。AlphaGo也是通过积累了数千万盘围棋对战棋谱数据,并进行充分的模型训练后,才打败了人类顶尖棋手的。 现实领域里,很多训练数据的积累工作才刚刚开始。尤其是监督式学习所需要的“标注数据(Labeled Data)”的积累,往往需要大量的人工参与,成本很高,大大制约了人工智能在相关领域里水平的提升。另外有一些领域的数据因为受到一些政策因素的限制,例如医疗数据,或者有些数据被部分行业企业垄断,这些都导致数据难以流通,人工智能的水平提升也就比较缓慢。 随着近年来计算机硬件存储成本的迅速降低,云计算的逐步普及,数据积累工作的硬件环境迅速改善。数据采集的意识也逐步觉醒,希望在应用需求的推动下,有越来越多的数据被数字化,并记录下来,训练出优秀的算法模型来提升效果。 从弱人类级起步,到强人类级、超越人类级、巅峰级,任重道远。科学发展的脚步通常都是先易后难、化繁为简。随着技术不断的积累与进步,相信未来在越来越多的应用领域里,人工智能技术都能代替人类,来完成越来越多有价值的工作。 陈运文,达观数据创始人兼CEO,复旦大学计算机专业博士,上海市计算机学会多媒体分会副会长,国际计算机学会(ACM)和国际电子电器工程师学会(IEEE)高级会员。曾任盛大文学首席数据官,腾讯文学高级总监、数据中心负责人,百度核心技术研发工程师,多次代表中国参加ACM等国际数据挖掘竞赛并获冠。返回搜狐,查看更多 (责任编辑:本港台直播) |