为什么 Hacker News 通常会给出这么糟糕的机器学习建议?尽管机器学习背后的理论需要大量高等数学知识,但是,这和实践中使用机器学习所需的实用知识还是非常不同的。作为一个数学博士,我知道,较之打造一个实际有用的模型,那些数学知识没预期中的那么有用。 其中暴露出的思路是有害的,原因如下: 完全错误。 好的教育会促进重要概念的研究。借用 Paul Lockhart 在 Mathematician's Lament 里的一个类比,如果先让孩子学习几年音乐理论,再让孩子碰乐器或者唱首歌,孩子会放弃音乐。 好的教育不会过度复杂化材料。如果你真理解一样东西,就可以用一种通俗易懂的方式来解释它。数周的 Practical Deep Learning for Coders 课程学习,Jermy Howard 仅用 Excel 表格就清楚解释了不同现代优化技术(这常常被视为一个复杂的话题)的运行原理。 就像我在几个月前写道的,挑一位你所在组织里的业内专家,让他们学习深度学习技术要比空降一位深度学习专家要好得多。深度学习博士毕业生不太可能具备大量广泛相关经验(而这些又是那些最高效员工身上最珍贵的东西),他们更有可能对解决有趣的工程问题而不是聚焦于那些商业上最重要的问题。 「以我们在很多产业和多年来将机器学习应用于一系列问题的经验看,一直会有不被看好和有好技术却不被投资的公司出现。在大数据时代,这意味着公司得把钱花在外面找咨询顾问。在错误的『深度学习排他性』这种观念传播的日子里,这意味着搜索那些独角兽深度学习专家意味着不景气的深度学习创业公司要为此支付过高的成本。」 破除夸张宣传(当你不是机器学习研究者时) 计算语言学家 Dan Simonson 受邀写了一本答疑指南。其中评价了 NLP、机器学习和人工智能并且指明了鉴别虚假信息的办法(?p=461): 是否存在训练数据?如果不是,我们怎么计划来得到它们? 他们是否有一个内置于自身应用开发过程中的评价机制? 他们提出的应用是否依赖于在特定人工智能组分上的前所未有的好表现? 提出的解决方案是否是基于证实的、可靠的现象? 如果使用了预装人工智能部件,他们是否有从使用这些部件到获得有意义的应用输出的明确计划? 作为一个 NLP 研究者,Simonson 对现在人工智能的发展非常兴奋,但是他指出当人们利用从业者和公众之间的知识断层时,整个领域就受到了伤害, 深度学习研究者 Stephen Merity(就职于 Salesforce/Metamind)写了一篇题目贴切的文章《机器学习不是魔法:帮助降低人工智能炒作而应该被提出的问题》(https://smerity.com/articles/2016/ml_not_magic.html),其中包括: 需要多少训练数据? 这项工作是否是无监督式(即不给样本进行标记)的? 系统能否根据词汇类别进行预测。(例如:想象一下,如果我说「我的朋友 Rudinyard 曾经对我很刻薄」,很多人工智能系统根本不能回答「谁对你刻薄」这个问题,因为 Rudinyard 不是该系统收入的词汇。) 当输入的故事变得更长时,精确性降低了多少? 在整个时段中模型的表现有多稳定? Merity 也提示道,模型经常基于被高度处理、规划了的或受限的数据集被评估,而这些数据集不能精确地反应你正在处理的真实数据。 这对你意味着什么? 如果你是一位有志向的机器学习从业者:好消息!不需要博士学位,不用从头开始从 CUDA 或 MPI 开始编写算法。如果你有一年的编程经验,我们推荐你试试 Practical Deep Learning for Coders 课程(),或者考虑一下我的额外建议:《》 (责任编辑:本港台直播) |