4月11日晚上7点到8点, IBM机器学习首席技术官Jean-Francois Puget ( JFP)博士,在知乎Live上开展了一场跟2190名知乎网友(也叫知友)的对话,分享了机器学习的相关趋势、IBM在机器学习的战略以及相关的研发投入,也用真实案例来说明了机器学习在商业领域的价值。 ” 一个小时的分享和沟通实在是有些短暂,很多知友的问题没有来得及回答,所以JFP在分享之后,针对知友们提出的问题进行了回答。我们将他的回答进行了翻译和简单的整理,以飨读者。
Q 成熟的机器学习算法是否已应用于商业上? 是的。机器学习已用于多个领域。其中之一就是经常使用矩阵分解算法的产品推荐。目前,将机器学习投入商用的其他领域包括自然语言处理、图像识别、销售预测、预测性维护、客户流失预测。 Q 机器学习能做什么?有哪些产品? 只要有了明确的业务目标和支持此业务目标的数据,就可以做许多事。例如,如果业务目标是减少订货后的送货时间,则必须拥有足够的历史数据,以便了解影响送达时间的因素。 Q 如何实现机器学习? 从一个明确定义的、小范围的项目开始。然后使用开放源码来构建模型。随后使用像 IBM Machine Learning 这样的行业平台来管理模型的生命周期。 Q 目前投入商用的语音识别、自然语言处理、图像识别只不过是语音客户服务。基于搜索和深度学习推荐、识别等,是否还有任何其他应用方向? 客户服务很关键,但还有其他与机器学习相关的领域。例如,预测性维护是应用机器学习的一个好想法。该想法的理念是使用 物联网收集各种设备的信息并预测它们的健康状况,以便可以预防故障。另一个领域是医疗健康,机器学习能帮助诊断,并帮助选择最佳疗法。 Q 对于分类,有哪些经典用例?您有何想法或建议?何时需要考虑复杂模型? 异常检测是一种经典用例,在该用例中需要对正常和异常情况进行区分。这是一个二类或二元分类问题。这包括欺诈检测(正常与欺诈)、预测性维护(正常操作与故障)、医疗健康(正常与疾病)等。我建议从简单模型开始,比如逻辑回归,如果准确性不够高且有大量训练数据,那么可以寻找一些更复杂的模型,比如梯度提升决策树或深度学习。 Q 您是否认为机器学习现在存在着泡沫/炒作? 是的。我认为深度学习被吹嘘过度了,而且人们的期望有些不切实际。深度学习很好,而且它实现了计算机视觉和自然语言处理上的突破。但这需要大量的投资和数据。大多数公司都没有足够的数据来让深度学习发挥作用。此外,在许多更适合使用机器学习技术的领域,深度学习不是首选的技术。我希望深度学习的优势和局限性得到更好的一般性解释。 Q 为什么深度学习更偏向于学术,而不是行业? 这种情况正在快速改变。效力于 IBM、Facebook、Google 等公司的大部分高级团队都不是学术性质的。但是,深度学习仍停留在研究阶段,尚未达到工程设计阶段。一个原因是深度学习未得到深入理解。设计正确的网络架构仍是少数人掌握的艺术。 Q 您对迁移学习有何看法? 这是个不错的想法。迁移学习可以在训练复杂模型时节省大量时间。 Q 如果深度学习的性能优于任何其他算法,它是否可能取代其他经典的机器学习算法? 深度学习在声音和图像方面具有更好的性能,但在其他领域没有突出表现。由于深度学习仍未取得良好结果,开奖,或者由于没有足够的训练数据,其他经典机器学习算法在一段时间内仍有许多机器学习应用。 Q 无监督学习的行业应用方向有哪些? 我认为无监督学习不会被广泛用作一项独立技术。无监督学习通常被用作监督式学习的一个预处理步骤。例如,建立数据集群,然后使用集群 id 作为新特性,这有助于提升监督式机器学习算法的性能。 Q 如果企业打算使用机器学习,应该如何开始使用它?技术门槛高不高?哪些行业拥有这种机会? (责任编辑:本港台直播) |