:COO、执行总编、主编、高级编译、主笔、运营总监、客户经理、咨询总监、行政助理等 9 大岗位全面开放。 简历投递:j[email protected] HR 微信:13552313024 新智元为COO和执行总编提供最高超百万的年薪激励;为骨干员工提供最完整的培训体系、高于业界平均水平的工资和奖金。 加盟新智元,与人工智能业界领袖携手改变世界。 【新智元导读】机器学习入门经典读物 Python Machine Learning 的作者 Sebastian Raschka昨天在Quaro回答提问,分享技术实践和经验。Sebastian 提到,Python Machine Learning 一书的是在课余时间完成的。他介绍说,开奖,当下机器学习面临的一个核心挑战是找到正确的表征,生物学和计算机科学的跨学科融合最近有很多激动人心的进展。另外,他还在机器学习的工具、理论知识储备和学习方法上给出了很多中肯且实用的建议。 作者简介:Sebastian Raschka 是 Python Machine Learning 一书的作者。MSU 计算机生物学博士候选人。 Quora 问答地址:https://www.quora.com/session/Sebastian-Raschka-1/1 Jupyter在需要做项目或者写报告赶Deadline时,可以救命 问:有没有一些你个人偏爱的工具,它们能让你的工作更加简便高效? 在一个较高的层次,我认为“计算机、编程语言和算法”是最关键的工具,它们让我可以处理所有各种各样的难题。 但是,如果要具体到“软件应用”层次,我喜欢Atom Editor(远程工作时,我依然还在使用VIM)。在我日常的工作中,每天我基本都需要编辑许多不同类型的文件: Python脚本, .cpp 文件, HTML 文件, Markdown, .tex, 纯文本文件, PSF 文件等等。因为支持跨平台工作(我同时在macOS 和Linux 上工作),以及丰富的嵌入生态,我很喜欢使用VIM。 不过,进行数据分析时,绝大部分时间我使用的是Jupyter Notebooks。我不会在Jupyter上“开发”代码,但是对我来说,它是追踪我研究轨迹的一个工具,正如笔记本一样。所有的东西都记在上面:执行代码、变量标记和命令等等,它不仅替我节约了时间,在需要做项目或者写报告赶Deadline时,它可能还可以救命。 我不想漏掉的还有git(Github)和做笔记的APP Quiver(只在Mac上可用),在Mac上有很多很好的笔记类APP,但是我最喜欢Quiver 的一点是,它可以让你以任何形式导出你的数据,这样你就不会受具体格式或者程序的限制。 没必要什么都学,关键是“选择”和“聚焦” 问:对机器学习或数据科学刚入门,但却不堪信息过载的初学者有何建议? 我觉得,现在有大量可用的学习资源,对于个人来说,既是好事也有不好。当然,我们能有那么多工具和信息资源可供选择是一件很好的事,但是怎样最好地利用它们,以及我们的时间更重要。真正地“选择”和“聚焦”是关键。 我并不想说很多资源是“冗余”,因为“冗余”一词多少都带有一些消极的意味。但是,现实情况是,确实有许多不同的书、工具和课程都包含了相同的东西,虽然他们在风格和领域略微有些不一样。 所以,在把任何东西加到我们的阅读清单之前,我想说的是,绝对地想清楚个人的目标是什么是非常有必要的。(比如,要解决某个问题,我真正需要的技术是什么?我真的会学习这一新的、有名的工具而不是别的什么?)。由于存在着大量的材料,当选择学习材料和采用不同的工具时,会挑选就变得很有必要。当然,有时候会产生我们错过了什么的感觉,但是我认为,习惯这种感觉能真正地帮助我们保持专注,获得稳步的发展。 例如,我认为一本“机器学习简介”就已经很足够了,实在没有必要再去读什么“机器学习的几条简介”,除非你真心觉得某个资源还不够深。 正如Cathy O'Neil 和 Rachel Schut所说,世界上不存在“完美”的数据科学家——没有人会有时间把一切都学会,每个人培养一些特定的技能,并在某个领域做得很好,就已经足够了。 我认为没有必要什么都学习,因为我们可以通过团队实现互补。 下图:数据科学家的专业知识构成
(From: Cathy O'Neil & Rachel Schutt. “Doing Data Science.”) 机器学习一个关键的挑战在于找到正确的“表征” 问:2016年,你认为机器学习的哪些发展最令你兴奋? 我对多问题类的技巧,比如卷积神经网络和递归神经网络在除了图像识别和自然语言处理这两个领域之外的应用尤为感兴趣。 (责任编辑:本港台直播) |