本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

报码:腾讯Angel 1.0正式版发布:基于Java与Scala的机器学

时间:2017-06-18 03:19来源:天下彩论坛 作者:j2开奖直播 点击:
深度学习是近些年来人工智能技术发展的核心,伴随而来的机器学习框架平台也层出不穷。到现在,一家科技巨头没有一个主导的机器学习平台都不好意思跟人打招呼,比如谷歌有

深度学习是近些年来人工智能技术发展的核心,伴随而来的机器学习框架平台也层出不穷。到现在,一家科技巨头没有一个主导的机器学习平台都不好意思跟人打招呼,比如谷歌有 TensorFlow、微软有 CNTK、Facebook 是 Torch 的坚定支持者、IBM 强推 Spark、百度开源了 PaddlePaddle、亚马逊则是 MXNet 的支持者。而为了尽可能地获得开发者支持和抢占发展先机,很多平台都选择了开源。

在去年 12 月 18 日的腾讯大数据技术峰会暨 KDD China 技术峰会上,腾讯大数据宣布推出了面向机器学习的「第三代高性能计算平台」——Angel,并表示将于 2017 年开放其源代,参见机器之心报道《腾讯大数据将开源高性能计算平台 Angel,机器之心专访开发团队》。现在,2017 年已经大约过去了一半,Angel 1.0.0 也终于在 GitHub 完全发布

Angel 发布地址:https://github.com/Tencent/angel

下载(.zip):https://github.com/Tencent/angel/archive/v1.0.0.zip

源码下载(tar.gz):https://github.com/Tencent/angel/archive/v1.0.0.tar.gz

据介绍,Angel 是腾讯大数据部门发布的「第三代计算平台」,是由腾讯大数据与香港科技大学、北京大学联合使用 Java 和 Scala 语言开发的面向机器学习的高性能分布式计算框架。它采用了参数服务器架构,解决了上一代框架的扩展性问题,支持数据并行及模型并行的计算模式,能支持十亿级别维度的模型训练。

不仅如此,Angel 还采用了多种业界最新技术和腾讯自主研发技术,性能更高、系统更具易用性。自去年年初在腾讯内部上线以来,Angel 已应用于腾讯视频、腾讯社交广告及用户画像挖掘等精准推荐业务。Angel 更是腾讯大数据下一代的核心计算平台。

下面,机器之心引用了 Angel 项目的 README.md 文件即其内部相关链接所介绍的内容,对 Angel 的功能、架构设计等内容进行了介绍,代码及最新动态请访问原项目。

报码:腾讯Angel 1.0正式版发布:基于Java与Scala的机器学

Angel 是一个基于参数服务器(Parameter Server)理念开发的高性能分布式机器学习平台,它基于腾讯内部的海量数据进行了反复的调优,并具有广泛的适用性和稳定性,模型维度越高,优势越明显。Angel 由腾讯和北京大学联合开发,兼顾了工业界的高可用性和学术界的创新性。

Angel 的核心设计理念围绕模型。它将高维度的大模型合理切分到多个参数服务器节点,并通过高效的模型更新接口和运算函数,以及灵活的同步协议,轻松实现各种高效的机器学习算法。

Angel 基于 Java 和 Scala 开发,能在社区的 Yarn 上直接调度运行,并基于 PS Service,支持 Spark on Angel,未来将会支持图计算和深度学习框架集成。

欢迎对机器学习有兴趣的同仁一起贡献代码,提交 Issues 或者 Pull Requests。请先查阅 Angel 项目贡献指南:https://github.com/Tencent/angel/blob/master/CONTRIBUTING.md

Angel 1.0.0 新特性

1.ParameterServer 功能

基于 Matrix/Vector 的模型自动切分和管理,兼顾稀疏和稠密两种格式

支持对 Model 进行 Push 和 Pull 操作,可以自定义复杂的 psFunc

提供多种同步控制机制(BSP/SSP/ASP)

2. 开发运行

语言支持:系统基于 Scala 和 Java 开发,用户也可以自由选择

部署方便:可以直接在 Yarn 社区版本中运行,也支持本地调试模式

数据切分: 自动切分读取训练数据,默认兼容了 Hadoop FS 接口

增量训练:训练过程中会自动 Checkpoint,而且支持加载模型后,增量训练

3.PS Service

只启动 PSServer 和 PSAngent,为其他分布式计算平台提供 PS 服务

基于 PS-Service,不需要修改 Spark 核心代码,直接开发 Spark-on-Angel 算法,该模式无缝支持 Breeze 数值运算库

4. 算法库

集成 Logistic Regression,SVM,KMeans,LDA,MF,GBDT 等机器学习算法

多种优化方法,包括 ADMM,OWLQN,LBFGS 和 GD

支持多种损失函数、评估指标,包含 L1、L2 正则项

5. 算法优化

LDA 采用了 F+LDA 算法用于加速采样的速度,同时利用流式参数获取的方法减少网络参数获取的延迟

GBDT 使用两阶段树分裂算法,将部分计算转移到 PS,减少网络传输,提升速度

Angel 介绍

1.Angel 的架构设计

报码:腾讯Angel 1.0正式版发布:基于Java与Scala的机器学

Client:Angel 的客户端,它给应用程序提供了控制任务运行的功能。目前它支持的控制接口主要有:启动和停止 Angel 任务,加载和存储模型,启动具体计算过程和获取任务运行状态等。

(责任编辑:本港台直播)

顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容