主流媒体中有关AI的报道倾向于认为机器学习算法是最重要的要素。它们似乎把算法等同于人类大脑。它们暗示正是算法让魔术发生作用,更精细复杂的算法能超越人类大脑。有关机器在国际围棋和象棋中战胜人类的报道就是例子。媒体关注的是“深度神经网络”、“深度学习”以及机器如何做决定。 这样的报道可能带给企业这样的印象:想要应用AI,他们得先聘请到机器学习专家来建一个完美的算法。但假如企业不考虑怎样获得更高质量、更大量的定制训练数据以让机器学习模型学习,就算有了完美的算法也可能得不到理想的效果(“我们有超棒的算法”和“我们的模型只有60%的准确率”间的落差)。 从Microsoft,Amazon和Google这些公司购买商用机器学习服务,却没有一个训练数据规划或预算,就好比买了一辆汽车,却没法到达加油站。你只是买了一大块很贵的金属而已。汽车和汽油的类比虽然不够恰当,因为如果你给机器学习模型补给越多的训练数据,模型就能变得越好。这就像汽车每用完一箱汽油,积累的里程数越大。所以训练数据甚至比汽油更重要。了解更多可以阅读我们此前的文章:More data beats better algorithms (https://www.crowdflower.com/more-data-beats-better-algorithms/) 所以,训练数据的质量和数量至少是与算法同等重要的。
神话5:机器>人 过去30年来,媒体一直喜欢把AI描述为比人类强大的机器,例如《终结者》的施瓦辛格和《Ex Machina》的Alicia Vikander。媒体这样做也可以理解,因为媒体想建立起机器和人类之间谁会赢的简单叙述结构。但是,这和实际情况不符。 例如,最近Google的DeepMind/AlphaGo战胜李世石的新闻被媒体简单描述成机器战胜了人类。这是不准确的,真实情况不是这样简单。更准确的描述应该是“机器联合许多人战胜了一个人”。
消除这种误解的核心理由是机器和人类具有互补的能力。请看上图。机器的特长是处理结构化计算,他们会在“找出特征矢量”任务上表现良好。而人类的特长是理解意义和上下文,他们在“找出豹纹连衣裙”任务上表现良好,让人类做“找出特征矢量”的任务就不那么容易了。 因此,对企业来说正确的框架是实现机器和人的互补,AI是机器和人的共同工作。
神话6:AI就是机器取代人类 主流媒体喜欢描绘反乌托邦的未来,因为它们认为这能吸引眼球。这样或许确实能吸引读者眼球,但是,它对真正理解机器和人类如何共同工作没有一点帮助。
例如,让我们再回到企业分类支持ticket的业务上来。在现今的大多数企业,这还是100%人工的过程。所以,这个过程又慢成本又高,能做的数量受到限制。假设你在分类了10000个支持ticket之后得到了一个准确率为70%的模型。30%的时候结果错误,但这时Human-in-the-loop就可以介入了。你可以把可接受置信度设置为95%,只接受置信度是95%或高于95%的输出结果。那么机器学习模型最初就只能做一小部分工作,比如说5%-10%。但是当模型得到新的人工标记数据时,它就能学习、进步。因此,随着时间的推移,模型能处理更多的客户支持ticket分类工作,企业也能大大增加分类的ticket量。
所以,机器和人联合可以增加工作量,同时保持质量,降低重要业务的单位经济效益。这就消灭了机器取代人类的AI神话。真相是,AI是机器强化人类。 神话7:AI=ML (责任编辑:本港台直播) |