2016年11月18日,人工智能代表企业第四范式在第三届世界互联网大会上,发布了国内首个支持部署在多公有云上的人工智能应用开发平台——第四范式?先知公有云版(以下简称“先知公有云版”)。先知公有云版面向不同阶段互联网公司,它聚合了先进的AI技术以及“部署即可用”的公有云产品形态,利用先知公有云版完成AI业务应用仅需一人月。第四范式希望以一种互联网思维,为互联网公司提供构建专属人工智能系统的能力。 专为机器学习而生的计算框架:极致运行速度、超高模型维度 区别于普通大数据应用,机器学习的计算任务具有小批量、多步迭代、通信频繁、逻辑复杂等特点,传统的 ETL式 计算并不能够满足机器学习计算任务的要求。为此,第四范式的科学家们开发了专为机器学习而生的计算框架——先知公有云版核心框架GDBT(General Distributed Brain Technology),GDBT在计算、通讯、存储、灾备等方面针对机器学习任务进行了深入优化,兼顾了开发效率和运行效率。 GDBT计算框架最主要的特点是对分布式支持数据并行化和计算并行化,即通过优化算法和机制,实现了机器与机器之间的协作而不是简单地分工,以减少无效的数据传输过程。实际结果表明,j2直播,在3000万条大数据环境下,GDBT的速度较Spark提升416 倍,帮助用户节省了99.76%的数据处理时长,而随着数据量的增大,GDBT的这一优势会更加明显,当数据量大到其它开源工具已无法工作的时候,GDBT的计算时间依然呈线性增长。 其次,GDBT计算框架能够同时支持连续、离散这两种数据的融合训练,将描述事件的特征由几十个提升至上百亿之多,保证模型可以充分利用对某件事情产生影响的最多特征数量。众所周知,高维度机器学习是机器学习的发展方向,人工智能巨头公司正在使用足够多的特征、更复杂的模型来提升AI的行业应用效果。但对于普通互联网公司来说,高维度的模型意味着巨大的资源与人力投入,因此不得不在效果和成本之间进行取舍。而专为机器学习而生的GDBT计算框架,能够实现超高维度的机器学习模型,将只有巨头才能拥有的万亿级特征量模型分享到每一家互联网公司,并能成熟应对巨大模型上线的工程挑战。此外,得益于优秀的模型效果,先知公有云版对数据量的要求惊人地降低到十万级别,让小数据也能产生强人工智能,这也是先知公有云版的核心优势所在。 丰富的应用场景:助力大部分互联网企业用人工智能创造未来 互联网公司最常见的业务场景,个性化推荐位居其一。以个性化推荐业务为例,利用先知公有云版搭建AI系统只需完成几个步骤。首先要定义问题,比如该模型是为了解决预估用户点击量或者是阅读时长等问题;在明确目标和所需数据后,便可以基于先知公有云提供的API进行数据闭环搭建,启动数据采集过程;用户也可以直接上传已有历史数据。因为先知公有云版拥有专利级的免清洗算法技术,对无效数据的容忍度极高,所以能够节省80%的数据处理时间;在此之后先知公有云版开始自动完成只有AI专家才能攻克的任务——算法调优和模型评估,并能够一步部署完训练好的模型、供业务使用。最后,先知公有云会建立完整的数据链路,让数据从线上到线下流畅地运转,帮助模型实时接收反馈、不断变强。可见,先知公有云版的使用步骤非常智能,目前的门槛只需充分理解业务与目标、并拥有一定量的数据。值得一提的是,日常使用中公有云版自带运维,进一步为互联网企业节约巨大的维护成本。 除了个性化推荐之外,先知公有云还适用于精准营销、风险管理等众多互联网应用场景,在实践中帮助企业赢得了优异的终端用户体验和更强的收益能力。 零门槛的机器学习平台:封装顶尖AI专家能力、高效构建AI系统 机器学习是一项新兴技术,拥有专业背景知识与研究经验的人才非常稀缺,而想要培养一个合格的AI人才需要6-10年。因此很长一段时间,人工智能都是巨头的独舞。与此相对的,是目前层出不穷的各开源工具,这些开源工具看似高效先进,但实际上,一个背景知识扎实的人使用起来都比较困难,需要完成大量学习、开发、试错的工作,这本身就是一个较大的门槛。 先知公有云版的开发目标,是让没有相关背景的人也可以创建出工业水准的机器学习模型,极大地降低人工智能的应用门槛,atv直播,基于此,先知公有云版提供非常易用的操作方式。一方面,先知公有云版通过容易理解的交互界面来建模,保证普通的业务人员都可以理解每一个步骤。另一方面,先知公有云版通过更灵活的部署方式,提供的一键部署到云端的实时预估服务,稳定无缝地嵌入到客户的业务系统中,且无需人工干预。 (责任编辑:本港台直播) |