智能医疗。美国南北卡罗莱纳州医疗系统(CHS)使用机器学习来为病人的情况打分。管理经理能使用这些分数来为病人服务优先次序排名。系统能让CHS实现个性化医疗。使用这一系统之后,CHS的再入院率从21%降到了14%。 Cisco 使用机器学习来建立产品的个人购买倾向分数。销售能使用该预测来发现最好的推销对象。 PayPal 在采用机器学习来实时识别可疑交易之前,每个月因为诈骗损失1000万美元。 以上的例子由两个关键的特征:第一,机器学习的输出,也就是病人风险分数、可能的购买意向分数以及欺诈预测,都产生了巨大的价值。第二, 它们之所以有价值,是因为它们值得信任。 从上面的例子,也可以看到,机器学习在以下四个方面可以做得很好: 在多个变量中找到复杂的交互; 从原始数据中学习低水平的特征; 预测高技术的分类,比如图像分类; 处理非标签数据。一些现象是多个变量间复杂交互后产生的,比如节育的发生率不仅是一个包含性别和年龄的函数,而是这两个变量一起与其他要素作用的结果。虽然专家能使用统计学知识对这些变量进行建模,但其过程需要消耗大量的人力和时间。机器学习能自动识别出这一交互过程,并且不需要过多的人为监督。 统计技术的成功很大程度上取决于用于搜集数据的能力,这一过程要求大量的专业知识和技巧。作为一种规则,机器学习技术在混乱或者不完整的数据上能有稳定的表现。机器学习,尤其是深度学习,加以大量拥有独特价值的数据,会产生很好的效果,实际的应用包括语音识别、图像识别或者推荐引擎。机器学习能从非标签数据中进行学习。这里所说的“非标签”只的是缺乏对意义的定义。非标签的图像、视频、新闻等都是非标签数据。 比起统计学,机器学习产生的结果人类更难理解。这样,当分析的目标是属性或者方差分析时,机器学习的用处就不大。 一些研究者尝试解决这一“黑箱”问题,他们进行了验证和模拟测试,想要知道在提供新数据的情况下,模型会有什么表现。部分依赖关系分析(partial dependency analysis)的方法,让了解机器是如何学习模型表现的成为可能。 机器学习的另一个潜在缺陷是,常常会发生过拟合问题,其中算法会对训练数据的独特个性产生“记忆”。一些机器学习算法采用了“嵌入”(built-in)控制避免这一问题。 机器学习算法要求复杂的计算,需要大量的计算能力。近年来,计算成本急剧下降,但是,计算并不是免费的,所以管理机器学习负荷问题也是一个巨大挑战。计算的复杂度会让部署变得很困难。 Netflix 曾举办过一个机器学习挑战赛,并给冠军团队颁发了100万美元的奖金,后来,Netflix 发现部署冠军团队的模型成本过高,不得不放弃。 IDC 预测:到 2020 年 AI 市场规模将超过 470 亿美元 尽管存在缺陷,但根据 10 月 26 日国际数据公司(IDC)发布的报告《全球半年度认知/人工智能支出指南》(Worldwide Semiannual Cognitive/Artificial Intelligence Systems Spending Guide):各行各业对认知系统和人工智能(AI)的广泛采用,将使全球在这两方面的收入从 2016 年的近 80 亿美提升至 2020 年的 470 多亿美元。也就是说,从 2016 年至 2020 年期间,认知/AI解决方案的复合年均增长率将达到 55.1%。 根据日前 IDC 官网发布的新闻稿,IDC认知系统和内容分析研究总监 David Schubmehl 表示:“软件开发人员和终端用户组织已经开始将认知/人工智能部署到几乎所有类型的商业化应用或流程中。 “几家大型科技公司的最新动向以及AI创业公司爆发的风险投资市场表明,企业需要制定并施行能把这些宽泛的技术综合起来的策略。识别、理解以及使用实例,技术,以及认知/AI系统的增长机会,将成为大多数企业的差异因素,这些技术造成的数据干扰将十分严重。” 根据 IDC 的这份报告,认知/AI系统能够使用算法和基于规则的逻辑识别并响应数据流,因而能够在许多不同行业中自动实现多种功能。2016年,吸引最多投资的AI使用实例是自动客服代理、质管调查及推荐系统、诊疗系统、以及欺诈分析调查系统。另外,在未来五年中,最快实现收入增长的使用实例是公共安全和应急响应系统、新药研究及发现、诊疗系统、供应和物流、质管调查及推荐系统、以及车队管理系统。 (责任编辑:本港台直播) |