本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

【j2开奖】机器学习经典 Python Machine Learning 作者:新书计划曝光,分享实战经验(3)

时间:2016-11-02 20:59来源:报码现场 作者:j2开奖直播 点击:
比如,回归分析中的简单线性回归和岭回归、分类中的逻辑回归和K-nearest 相邻以及聚类任务中的 k-means 和层级聚类。一旦你理解了每一个算法的目标,以

  比如,回归分析中的简单线性回归和岭回归、分类中的逻辑回归和K-nearest 相邻以及聚类任务中的 k-means 和层级聚类。一旦你理解了每一个算法的目标,以及他们如何尝试去解决一个特定的问题,那么再增加更多的算法和方法就会相对容易。但是,除了算法之外,如何准备数据也是很重要的(特征选择、转化和压缩),还有如何评估模型也很重要。也许,作为一个初学者,你可以试试我们在 SciPy 2016的 scikit-learn 机器学习。它长达近6小时,归纳了大部分的基础知识,并介绍了scikit-learn数据库,你能即刻上手。

  如果你想理解算法背后的数学原理,推荐你去上吴恩达的线上课程,或者读我的书。不过,我认为这两件事(一般)不是在10天的计划之内(能完成的)。

  学霸的世界:课余时间写出 Python Machine Learning

  问:你怎么有时间掌?match ?握机器学习,同时又写了一本书,还在另外一个领域读博士?

  我认为,涉及到解决问题的时候,机器学习和计算机生物学之间有很大的重叠。在计算机生物学中,我们通过计算来解决问题,一般会使用各种各样的“数据挖掘”技术,而机器学习本身就是由一系列“数据挖掘”管道组成的。我对统计学领域也很感兴趣,最早是在研究生阶段,我上了“统计学模式识别”的课程。我为什么要提到这个?我认为这门课程真正地点燃了我对预测模型和机器学习的热情。首先,我的第一感觉是“哇,这太难以置信了,它能让我以计算机生物学的方式解决所有的问题”。后来,我想,“机器学习那么重要,那么激动人心,它能让我解决几乎所有的问题,我怎么学都不够。”

  在修读完课程之后,几年之间,我对机器学习真正的产生了热情,我可以利用课余时间去学习这一学科,有时候甚至学到半夜。坦白说,在写书之前,机器学习中有很多主题我都还没有深入了解,有大量的论文我还没有机会去看。但是,在受邀写书的时候,我幸运地发现,这一主题是我完全可以利用此前研究轻松把握的。虽然我只是每天在夜里写几个小时,或者利用周末的时间来写,在那几个月,我完全没有社交生活,但这完全是我凭着热情去写的:我真的很激动能分享自己学到的东西,自己觉得很兴奋的东西,这让写书的过程充满了乐趣。最后,我想写书或者完成博士项目是我101%兴奋的东西,所以我愿意把时间都花在这上面。

  为了学习而学习很快会无聊,解决方法是从问题出发

  问:数据科学初学者如何才能更好地掌握好数据科学技术,你有什么建议?

  我的建议是选择你个人感兴趣的问题或项目,而不是重复一个已经以教程或其他形式提供了解决方案的问题。如果你对要解决的问题具有强烈的个人兴趣,自然会更积极地寻找解决方案,探索新的工具和技术。

  首先,我会从已经熟悉的技术和工具入手。如果遇到可用的工具包,我会搜索类似的问题或直接与人讨论。例如,假如你对某种预测很感兴趣。开始时,你可以把键值数据对存储到Python词典中。随着数据集变大,你可能需要寻找替代方案,例如,SQLite,那么你需要花时间学一下SQLite。同样,你可以用NumPy阵列做很多事情,但是在收集异质数据时,可能需要用Pandas来更方便地对数据进行预处理。如果系统内存成了瓶颈,也可以试试其他工具,例如Blaze。

  我推荐的方法是学习你认为对解决你的问题有帮助的工具,并使用它们作为基准以熟悉使用。第二步是为你的工具寻找可能带来额外好处的潜在替代方案。

  最终,我发现只是为了学习工具而学习工具很快就会变得非常无聊,所以我的方法是在实践中学习工具。如果实践的项目令人振奋,你会自然地花更多时间采用新的工具来进行改进。

  原型设计用 Octave,但我是个 Python/R 人

  问:机器学习中,使用Octave 有多简便高效?

  我认为 Octave 对于原型设计(prototyping)来说是一个高效的环境,它和MATLAB 一样,都是学术界非常受欢迎的计算机科学环境。在好几所大学中,我都必须使用Octave来提交我的作业和项目,我必须要说,对于学习机器学习来说,这绝对是一个很好的选择。但是,看起来在现实的应用中,Octave/MATLAB也是一股新的趋势,我还想说,其他的语言,比如Python也很容易上手,也比较通用。(但是鉴于我是一个Python人,可能会有些主观)。

  简而言之,如果实验室或者课程要求的话,我肯定会选择 Octave ,否则,我更偏向 Python或R。

  你也可以试着写本书

  问:我很喜欢你的Python Machine Learning,你有计划再写一本吗?

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容