整理&编译:刘小芹、李静怡、胡祥杰
新智元启动新一轮大招聘:COO、执行总编、主编、高级编译、主笔、运营总监、客户经理、咨询总监、行政助理等 9 大岗位全面开放。 简历投递:j[email protected] HR 微信:13552313024 新智元为COO和执行总编提供最高超百万的年薪激励;为骨干员工提供最完整的培训体系、高于业界平均水平的工资和奖金。 加盟新智元,与人工智能业界领袖携手改变世界。 【新智元导读】在 ThingsExpo 会议上,谷歌软件工程师 Natalia Ponomareva 作了有关如何在大规模机器学习中取得成功的讲座。Natalia 回顾了可用于对大量数据进行机器学习模型训练的框架,解释了特征工程和算法选择,并提供了有关如何避免错误的 tips。这是一份非常实用的机器学习指导手册。本文后半部分谈了如何选择深度学习框架的问题,以及Theano 贡献者、苏黎世联邦理工学院的深度学习研究者 Gokula Krishnan Santhanam 对常用深度学习框架基本构成的分析。 【进入新智元微信公众号,在对话框输入“谷歌MLppt”,可下载32页ppt】 谷歌机器学习:实际应用技巧
什么是机器学习(ML)? 从概念上讲:给定(训练)数据,发现一些潜在的模式并将这个模式应用于新数据。 ML 的类型:监督学习;无监督学习;半监督学习;……
监督学习:用于训练的输入数据有标记。 分类(学习决策边界)。示例:文本/图像/视频分类,垃圾邮件检测等 回归(学习预测连续值)。示例:预测房价,预测用户愿意支出的金额等
无监督学习:输入数据没有标记,尝试在数据中查找“隐藏的”结构。 聚类 异常值/异常现象检测 示例:对聚类流服务用户进行分组,对这些组以及某个视频在这些组中的受欢迎程度进行分析。
ML如何帮助企业业务 个性化服务(为每个用户提供量身定制的独特的体验),可以最大限度地提高参与度和收入 自动化执行一些容易出错或需花费大量时间的任务(如转录,字形识别等) 分析数据,提出更好的决策方案 ……
从小处着手:数据取样;初始特征标记;建一个简单的模型,看看它性能如何 Scale:用完整的数据训练;改进特征(特征工程);尝试不同的算法(模型选择)
特征工程(feature engineering)是什么? 在概念上,特征工程是将原始数据(日志,产品购买的历史记录或上网行为等)转换成可以由学习算法在训练和预测中使用的矢量(vector)的过程。 它是高度领域特定的。 取决于你试图从数据中学习什么。 劳动密集型
特征工程:如何做? 高级步骤: 决定你想要获得的洞察力(例如,我们想训练一个模型,为用户听歌提供推荐)。 (责任编辑:本港台直播) |