这个方法我讲过很多次,也在我的博文“Understand Machine Learning Algorithms By Implementing Them From Scratch”中提供了很棒的小窍门和资源。
在这篇博文中,我还针对这个方法推荐了三本书 Data Science from Scratch: First Principles with Python ?tag=inspiredalgor-20 Machine Learning in Action ?tag=inspiredalgor-20 Machine Learning: An Algorithmic Perspective ?tag=inspiredalgor-20 交付一次性预测信息的开发人员 一个开发人员不一定得是很棒的程序员,而编程也不需要交付一个准确可靠的预测模型。 一个一次性的预测模型可以在商业环境中提供一套预测信息。在自学、处理实际数据集甚至在机器学习竞赛中,这种模型都算是非常理想的。 如果你经历过系统地解决问题的全部过程,并提供出一个独立的模型,atv,你将获益良多。 Data Mining: Practical Machine Learning Tools and Techniques ?tag=inspiredalgor-20 Applied Predictive Modeling ?tag=inspiredalgor-20 你可以从我的博文“Process for working through Machine Learning Problems”中了解到端对端的解决机器学习问题的系统流程。
改进软件和服务的工程师 一个工程师要想在他们的软件项目中加入机器学习,需要掌握的知识包括算法、端对端解决问题、以及在软件实际运转的情况下如何让算法可靠执行。 这类人群是从前面的两类人群成长而来的,称他们为机器学习工程师可能更恰当。他们致力于使用高速的算法来提供准确可靠的结果,并在二者中寻求平衡。 这类人群也大量使用了机器学习书库和基础架构。 在启动中的机器学习书库中,包括如下有用的资源: Building Machine Learning Systems with Python ?tag=inspiredalgor-20 Learning scikit-learn: Machine Learning in Python ?tag=inspiredalgor-20 Practical Data Science with R ?tag=inspiredalgor-20 Machine Learning with R ?tag=inspiredalgor-20 另外,还可以参阅文章“Building a Production Machine Learning Infrastructure”。
➤数据人群 通常来说,这类人群主要跟数据打交道,但可能也需要用到机器学习的知识。 希望获得商业问题优化方案的数据科学家 一名优秀的数据科学家,绝不能停止学习。 你必须了解最新的数据流、技巧和算法。这包括你需要用来描述数据和创建预测模型的机器学习技能。 从“工程部落”项下列出的更为实用的资源中,以及从“学术部落”项下列出的更为理论化的资源中,数据科学家可以获取自己需要的资源。 但是一些以数据科学为主的机器学习资源既有实用性又有理论性,这些资源包括: Applied Predictive Modeling ?tag=inspiredalgor-20 An Introduction to Statistical Learning: with Applications in R ?tag=inspiredalgor-20 Machine Learning for Hackers ?tag=inspiredalgor-20 希望能更好地解释数据的数据分析师 数据分析员主要对商业利益背景下的数据解释感兴趣。有时,机器学习算法有助于得出性能更好的模型。这些模型大多为描述模型,但是有时也包括预测模型。 和“普通研究人员”这个群体一样,atv,这个群体可能在统计学和统计推论上有着良好的基础。另外,由于他们对描述模型最感兴趣,因此掌握线性回归和逻辑回归之类的经典算法可能就足够了。相对于准确性,所得模型的解释能力更好。 从统计推论的角度而言,上文提到的资源很很有用。 关注者 从1到10000+ 我们每天都在进步 (责任编辑:本港台直播) |