本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

【j2开奖】KDnuggets 本月最受欢迎:5 个不容错过的机器学习项目

时间:2017-01-20 15:41来源:本港台直播 作者:开奖直播现场 点击:
新智元启动新一轮大招聘 :COO、执行总编、主编、高级编译、主笔、运营总监、客户经理、咨询总监、行政助理等 9 大岗位全面开放。 简历投递:j [email protected] HR 微信: 13552313024 新

  新智元启动新一轮大招聘:COO、执行总编、主编、高级编译、主笔、运营总监、客户经理、咨询总监、行政助理等 9 大岗位全面开放。

  简历投递:j[email protected]

  HR 微信:13552313024

  新智元为COO和执行总编提供最高超百万的年薪激励;为骨干员工提供最完整的培训体系、高于业界平均水平的工资和金。

  加盟新智元,与人工智能业界领袖携手改变世界。

  【新智元导读】受欢迎的机器习项目很多,它们受欢迎的程度体现在在 GitHub 上获得的星数(Star)。,本文作者发掘了几个数据科机器学习被人错过好项目。即使你不需要使用这些特定的工具,但检查它们的实现细节或项目的代,可能带给你一些新的启发。

  Hyperopt-sklearn

  Star:219

  GitHub地址:https://github.com/hyperopt/hyperopt-sklearn

  Hyperopt-sklearn 是基于 Hyperopt 的模型,用于 scikit-learn 项目中的机器学习算法。项目文档里的介绍如下:

  找到适用你的数据的正确分类器可能很难。选好分类器后,为了获得最佳结果而对所有参数进行微调也非常乏味而且耗时。而且有可能在你做完所有这些艰苦的工作后,才发现从一开始就选择了错误的分类器。Hyperopt-sklearn 为这些问题提供了解决方案。

  Hyperopt-sklearn 使用多种搜索算法,可以搜索所有(支持的)分类器,或仅在给定分类器的参数空间内进行搜索,并且支持多种预处理步骤,如 PCA,TfidfVectorizer,Normalzier 和 OneHotEncoder。

  那么它的效果如何?

  下表是使用 scikit-learn 的默认参数运行分类器得到的F1分数,以及在20个新闻组数据集上的 hyperopt-sklearn 优化参数。hyperopt-sklearn 的结果来自25次评估的单次运行。

  

【j2开奖】KDnuggets 本月最受欢迎:5 个不容错过的机器学习项目

  Hyperopt-sklearn 只需非常少的额外代,并有一些方便的快速启动代码。

  Dlib

  Star:1281

  GitHub地址:https://github.com/davisking/dlib

  Dlib 是一个通用的工具包,用于使用C++进行机器学习和数据分析应用。它是用C++编写的,也有一个 Python API。

  

【j2开奖】KDnuggets 本月最受欢迎:5 个不容错过的机器学习项目

  官网的介绍如下:

  Dlib 是一个现代C++工具包,包含机器学习算法和工具,用于使用C++创建复杂的软件来解决现实问题。它在工业界和学术界的各领域都有广泛应用,包括机器人、嵌入式设备、移动电话和大型高性能计算环境。

  文档达到标准,API也得到很好的解释,并且该项目带有简明的介绍。博客社区也很活跃,介绍了一些有趣的项目。Dlib 不是新的项目,它自2002年以来一直在发展。

  NN++

  Star:184

  GitHub地址:https://github.com/stagadish/NNplusplus

  NN++ 是一个 C++ 实现的轻量级、非常容易使用的神经网络,它无需安装,直接 #include 即可。

  项目repo的介绍如下:

  NN++是一个简短,自包含,atv,易于使用的C++神经网络实现。它包括神经网络实现和一个用于基本线性代数运算的 Matrix class。这个项目主要是为学习目的而建,但在 MNIST 数据集的初步测试结果显示了不错的性能。

  它的文档是稀疏的,但需要额外解释伴随的 Matrix class 的使用。GitHub库中的一些代码片段解释了如何设置和查询神经网络。这里的代码是最小限度的,所以想要了解简单的神经网络或从其他语言直接跳到用C++实现网络,这个项目是值得一看的。

  LightGBM

  Star:2362

  GitHub地址:https://github.com/Microsoft/LightGBM

  官方repo的介绍如下:

  一个基于决策树算法的快速、分布式、高性能的梯度提升(GBDT,GBRT,GBM 或 MART)框架,通常用于排序、分类等机器学习任务。它是微软的 DMTK(分布式机器学习工具包)下的一个项目。

  LightGBM 用 C++ 和 Python 编写,提供了快速入门指南,并行学习指南以及功能的概述。

  

【j2开奖】KDnuggets 本月最受欢迎:5 个不容错过的机器学习项目

  它的表现如何呢?

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容