我很高兴听到你喜欢我的《Python Machine Learning》。是的,我正计划写另一本书!在 2015 年我上一本书之后,我在学术界度过了非常忙碌的一年,我在教书、写论文、参加会议……上花掉了大量的时间,而且在写作新书之前我还需要休息一下 :) 但长话短说:我正计划写一本关于模型评估(model evaluation)的书。我收到过关于这个主题的很多问题,而且其往往只在介绍性的书里面有一些简短的介绍。因此,我今年开始写作关于「机器学习中模型评估、模型选择和算法选择的博客」(),但关于它的更多内容我想在一本书(Model Evaluation and Selection in Machine Learning:https://leanpub.com/meval)中扩展——通过使用 Python/scikit-learn/Tensorflow 的说明性的和实用的代码例子来增强这些概念。(另外,我相当确定未来某天我还会写一本关于深度学习的书。) 9. 我可以如何在 10 天之内学会机器学习? 10 天?嗯,这绝对很有难度 :)。但是,我也认为 10 天是一个你需要用来很好地整体了解机器学习领域的时间框架,也许还能开始将一些技术应用到你的问题上了。 在阅读了机器学习三个不同的子领域(监督学习、无监督学习和强化学习)的介绍之后。我可能会花时间了解一下这些领域内代表性的简单(但有用的)算法(可能要把强化学习放到后面一点)。比如:用于回归分析的简单线性回归和 Ridge 回归、用于分类的 logistic 回归和 k-最近邻、以及用于聚类任务的 k-均值聚类和分层聚类。一旦你了解了每种算法的目标和它们解决特定问题的方式,你就能轻松地为你的知识库增加更多算法和方法。但是除了算法之外,你还要清楚如何准备你的数据(特征选择、变换和压缩)以及如何评估你的模型。也许,作为初学者,你可以查看我们在 SciPy 2016 上的 scikit-learn 机器学习教程。它大概有 6 小时长,并总结了大部分基础,还介绍了 scikit-learn 库,这些库可被用于实现和进一步的学习。 教程地址: https://www.youtube.com/watch?v=OB1reY6IX-o&feature=youtu.be https://www.youtube.com/watch?v=Cte8FYCpylk&feature=youtu.be 10. 人工智能会颠覆设计行业吗? 当然,我肯定这么想。人工智能或机器学习已经在很多设计相关的领域得到了应用。从提升图像质量到 Stitch Fix 的个人造型(https://www.stitchfix.com/)和自动驾驶汽车。另一个将自动算法整合到设计里面的例子是 NASA 用在太空船上面的「进化天线(evolved antenna)」。 人工智能和机器学习可能并不会完全取代设计师,但我认为它将成为设计师的工作流程中「机械性的(mechanical)」部分中不可缺少的部分。或者换句话说,我认为这是一种增强而非完全的替代。但我预计「设计(design)」将随时间变得越来越好,因为特定的人工智能驱动的流程将能帮助缺乏人力或资源的公司或行业实现「好」的设计。 11. 你如何鉴定机器学习是否对一个项目有用? 第一步需要考虑这个项目的主要目的以及完成目标的需要那些步骤。一旦我确定了某个问题可以用一个预测模型(一个分类器或回归器)来处理,或一个聚类算法(clustering algorithm),我会问自己这些数据是否适用于这个任务。 如果这是一个监督学习任务,我能访问这些标签/目标变量吗?如果不能,我能不能从别的地方获取?是否有足够的可用样本?在一个机器学习算法中,我能不能以某种适当的格式(也许是表格)表达这些输入数据? 还有,如果我有一个可以轻易可视化或手绘的简单的一维或二维数据,用机器学习处理可能会有点过。 例如,我或许不会为预测分子重量拟合一个回归模型,因为它是输入的结构。举个例子,给定一个乙酰水杨酸分子,它的分子结构是: 我们得到了包含 9 个碳原子、8 个氢原子和 4 个氧原子的化合物; C ~ 12 g/mol H ~ 1 g/mol O ~ 16 g/mol 所以我们可以轻松计算出它的重量。 (责任编辑:本港台直播) |