· PythonEcosystem (适合中级学习者). 尤其是SciPy平台的pandas和scikit-learn。开发时你可以直接使用上面的代码和模型,它们的可靠性足够用来运行操作了。 · R Platform (适合高级学习者).R语言是为统计计算设计的,虽然语言艰深而且部分软件包文档很少,但它提供了很多方法。 针对专门领域,推荐的工具如下: · 用于深度学习的Keras. Keras使用Python语言,意味着你可以充分利用整个Python生态系统,节省大量时间。它的界面非常干净,同时也支持Theano和Keras后端。 · 用于损失函数的XGBoost. 这是能最快实现损失函数的工具,它也支持R语言和Python。 以上只是我的一些个人推荐。同时也要学习怎样使用你选择的工具,成为这方面的专家。 用哪种编程语言? 用哪种编程语言都没关系,甚至用哪种工具也不会有什么影响。你在一个平台上实践时学到的技巧也能很容易转移到另一个平台。 第4步:用数据集练习 确定了程序和工具后,就需要练习,做很多练习。 用标准机器学习数据集练习。 · 使用从现实问题(而不是人造问题)中收集的真实数据集 · 使用适合内存和excel表单的小型数据集 · 使用好理解的数据集,以便预测结果类型 (责任编辑:本港台直播) |