wzatv:【j2开奖】盘点 | 今年GitHub排名前20的Python机器学习开源项目(2)_本港台直播_J2开奖直播

13.Orange3是一个新手和专家都可以使用的开源机器学习和数据可视化工具。在交互式数据分析工作流程中拥有大型的工具箱。

提交：6356，贡献者：40

链接：https://github.com/biolab/orange3

14.Pymc 是一个实现贝叶斯统计模型和拟合算法的 Python 模块，其中包括马尔可夫链和蒙特卡罗方法。其灵活性和可扩展性使其适用于大量问题。

提交：2701，贡献者：37

链接：https://github.com/pymc-devs/pymc

15.PyBrain是 Python 的一个模块化机器学习库。它的目标是为机器学习任务提供灵活且易于使用但仍然强大的算法，以及各种预定义环境来对你的算法进行测试和比较。

提交：984，贡献者：31

链接：

16.Fuel是一个数据管道框架（data pipeline framework），它为你的机器学习模型提供所需的数据。它将被 Blocks 和 Pylearn2 神经网络库使用。

提交：1053，贡献者：29

链接：

17.PyMVPA 是一个用于简化大型数据集的统计学习分析 Python 包。它提供了一个可扩展的框架，具有大量用于分类、回归、特征选择、数据导入和导出等算法的高级接口。

提交：9258，贡献者：26

链接：https://github.com/PyMVPA/PyMVPA

18.Annoy（Approximate Nearest Neighbors Oh Yeah）是一个绑定 Python 的 C ++库，用来搜索在空间中距离给定查询点较近的点。它还创建了基于大型只读文件的数据结构，这些数据结构被映射到内存中，以便许多进程可以共享相同的数据。

提交：365，贡献者：24

　　链接：https://github.com/spotify/annoy

19.Deap 是一个用于快速原型和测试思想的新颖的进化计算框架。它试图使算法更加浅显易懂，数据结构更加透明。它与并行机制（例如 multiprocessing 和 SCOOP）能完美协调。

提交：1854，贡献者：21

链接：https://github.com/deap/deap

12.Pattern 是 Python 编程语言的 Web 挖掘模块。它捆绑了数据挖掘（Google + Twitter +维基百科 API、网络爬虫、HTML DOM 解析器）、自然语言处理（词性标记、n-gram 搜索、情感分析、WordNet）、机器学习（向量空间模型、k-means 聚类、朴素贝叶斯+ k-NN + SVM 分类器）和网络分析（图形中心性和可视化）等工具。

提交：943，贡献者：20

　　链接：https://pypi.python.org/pypi/Pattern

从下面的图表中我们可以得知，与其它项目相比，PyMVPA 具有最高的贡献率。令人吃惊的是，相比于其它项目，尽管 Scikit-learn 的贡献者最多，但是它的贡献率比较低。这背后的原因可能是因为 PyMVPA 是一个新的项目，经历了早期的发展阶段，由于新的想法/功能开发，缺陷修复，j2直播，重构等原因导致了许多提交。而 Scikit-learn 是一个早期的并且比较稳定的项目，所以拥有较少的改进或缺陷修复等提交。

wzatv:【j2开奖】盘点 | 今年GitHub排名前20的Python机器学习开源项目

我们对 2015 年和 2016 年的项目进行了比较，它们都是排名前 20 名的项目。我们可以看到 Pattern、PyBrain 和 Pylearn2 的贡献率没有明显的改变，也没有新的贡献者。此外，我们可以在贡献者的数量和提交的数量中看到一个显著的相关性。贡献者的增加可能会导致提交的增加，这也是我认为开源项目和社区神奇的地方；它可以导致头脑风暴，产生新想法以及创造更好的软件工具。

wzatv:【j2开奖】盘点 | 今年GitHub排名前20的Python机器学习开源项目

以上就是 KDnuggets 团队根据贡献者数量和提交数量对 2016 年排名前 20 的 Python 机器学习开源项目的分析。

开源和知识共享是令人快乐的一件事！

　　原文连接：

----------------------------

(责任编辑：本港台直播)