做“数据科学家版Office”,「DataExa」希望推进AI平民化 2017-08-14 09:30 来源:36氪 原标题:做“数据科学家版Office”,「DataExa」希望推进AI平民化 科技巨头企业,如Alphabet、Facebook、微软、BAT等掌握了海量的数据,笼络了顶尖科学家,拥有更雄厚的资金实力,成为前沿科技底层技术的主要竞技者,对于创业者而言,这是一个“神仙打架”的赛道。 垂直领域也有应用数据智能的需求,要将前沿科技落地于垂直行业,存在以下难题: ① 需要找到有实效的落地场景; ② 即懂业务又懂技术的复合型人才一将难求; ③垂直行业的数据源无法打通,“数据孤岛”限制应用; 尽管有Tensorflow,PyTorch,Theano和Keras等开源的机器学习平台,让AI的开发得以部分去中心化,垂直行业的企业要从0到1开发应用仍然有较高的门槛:需要从数据采集开始,再做数据储存、清洗、挖掘,然后才是机器学习、算法选择与调试、模型评估,最后才是产品发布。 能不能有一个工具集成的平台,就像Excel之于财会从业者一样,帮数据科学家省去重复性高、技术含量低的环节呢? 36氪最近接触的DataExa,是一家提供“行业+数据智能”解决方案的科技公司。 DataExa主要有两款产品,数据洞察平台DataExa-Insight以及 认知计算平台DataExa-Sati,借用这两个平台,垂直行业的企业要搭建具体场景的模型或者行业图谱时,可以省去从第一行代码到具体与场景结合的前期准备工作。 DataExa-Insight是一个机器学习和深度学习平台。平台内置了逻辑回归、随机森林、GBDT等40多种常见的机器学习以及100多个神经网络层,包括细化的CNN、RNN、LSTM、RBM等 。算法中参数配置的颗粒度可以做到与微软Azure Machine Learning水平相较的程度。 在现有算法不适用时,DataExa-Insight也支持技术人员自定义算法,可开放接口,提供SDK做二次开发。创始人兼CEO洪万福表示,目前这些知名厂商的产品都不支持在可视化建模平台上自定义算法 。 DataExa-Insight的产品开发基于Hadoop、Spark、TensorFlow等开源平台。市场上也有类似的平台,如阿里云的数加PAI、微软的Azure Machine Learning,与之相比,DataExa-Insight的优势在于跳脱了巨头体系的兼容性——使用通用模型格式,可跨行业重复使用,产品复用度高,研发边际成本可以下降。 另外,大厂商现阶段只支持公有云服务,而DataExa主要提供私有化部署服务。 DataExa-Insight的另一个亮点在于,支持机器学习和深度学习算法的可视化建模和模板化建模,开奖,数据分析师工作过程中可以更专注于如何与场景中的具体问题结合。 DataExa-Insight的目标还包括数据科学家和不熟悉技术业务分析师。洪万福表示,因为垂直领域的企业大多初步接触数据智能行业,所以即使提供标准化开发平台,仍然需要定制化地为客户开发解决方案,atv直播,不过行业的最佳实践可以跨行业应用。DatExa-Insight在公安反恐、消费金融风控、精准营销等领域都有最佳实践模型。 DataExa另一款主打产品是语义计算平台DataExa-Sati,基于自然语言处理、图储存计算、问答系统、推理引擎等技术,挖掘非结构化、半结构化数据,帮助用户建构行业知识图谱的平台。 DataExa-Sati类似的产品有Spark GraphX、Palantir Gotham、IBM Watson、IBM-i2 Analyze等。相比之下,DataExa-Sati的特点是拥有超过150+功能的图计算引擎,以及类似Wolfram|Alpha的计算推理引擎。 DataExa-Sati可应用于公共安全情报分析、金融征信、反欺诈、各行业用户画像与精准营销、复杂社交网络图谱等。 洪万福表示,公安反恐和金融是DataExa应用比较成熟的领域,市场推广方面主要通过与渠道商合作。 DataExa创始人兼CEO洪万福曾任清华同方软件出口首席架构师、戴尔高级架构师、科宇集团副总裁。团队其他成员还包括微软剑桥研究院博士后、剑桥大学机器智能博士、博士后等。 DataExa此前曾获得千万级天使投资。 『本文头图来自:Yestone 邑石网正版图库』 ----------------------------------------------- 我是Ruby,关注金融相关创业项目,项目报道可联系微信 LT297759835,烦请注明公司职位和来意。返回搜狐,查看更多 (责任编辑:本港台直播) |