从两个角度上来解决这个问题:首先,是机器学习的问题。第四范式设计了一个机器学习平台,这是让所有人都可以建模,把我们的数据、模型、上线的过程变成一个可视化的方式进行建模,通过这种方式我们可以让一个没有经过特别多机器学习训练的人很快的上手机器学习,用上机器学习,用上最新的算法。 大家还是不知道这个可以干什么?举个实际的例子。去年年末,我们组织了一个建模大赛(机器学习建模大赛),这是全球首个面向非专业人士的机器学习建模大赛。“非专业”到什么程度呢?不允许有机器学习背景的人参加,参加的人都是我们公司的行政、人事、市场、销售这样的人员。 我们会发现一个非常惊讶的结果,业务人员建出来的模型和我们专业的工程师科学家团队(有3到5年专业培训的科学家)建出来的模型,有差不多的效果。“先知”封装了机器学习底层的算法、计算资源、闭环等,让所有人都可以建模,你也可以,他也可以,我也可以。 在这个基础上,我们继续更进了一步,我们做了一个“范式大学”的项目,我们希望没有机器学习背景的人可以越来越多的参与进来。“范式大学”通过培养非专业人士利用“先知”建模,“批量生产”数据科学家,进一步解决AI人才高门槛的问题。第一期毕业生经过了一个月的培训,我们发现,他们已经拥有非常专业的建模能力,可以做一些非常好的建模应用。 此外,人工智能还面临数据量不足的问题。看看用人工智能成功的公司,比方说谷歌、百度。这些公司拥有的一个共性是,他们拥有大数据。 对比18世纪的工业革命对世界造成的影响,当时蒸汽机这样的技术发明,让整个世界发生翻天覆地的变化。但是蒸汽机这个技术的发明,导致了我们出现了一批资本家,这些资本家拥有了这些技术、拥有了生产资料,同时就拥有了巨额资本,这样就会产生金融寡头,我们不希望将来的财富永远只集中在金融寡头身上,我们希望所有人都可以平等的拥有财富。 现在我们正在面临一场智能的革命,在这里面我们会发现,它一定会出现一些数据的寡头、数据的资本家。它现在拥有好的业务,就会拥有更多的用户及用户数据,这样他就会垄断数据,从而垄断人工智能,这是一件非常可怕的事情。 我们不希望这样的事情发生。如何可以阻止?我们也在想一个新的技术,叫迁移学习。简单说,就是一个举一反三的能力,就是说你学习的英文,你就可以学法语,有了举一反三的能力,你就不需要更多的数据。 我们有一个做电影的网站,这就是国外的豆瓣,如果你在上面有很多的行为,但在亚马逊上没有购买行为,你也可以用这个数据帮助你做更好的预测,来判断是否会在亚马逊上做购物。 除了刚才的应用还有其他的应用,比如文本的数据比图片的数据多,无论是互联网上还是离线的应用上。我们也可以试图用文本的数据来帮助我们进行图片方面的训练。通过文本的数据,加上一些很少的图片去进行图片分类。 我们发现这件事确实可以。用100张图片训练的模型,和200页书训练的模型的效果差不多。我们转化了一下,这就跟中国的古话差不多,叫一图胜千言。 谷歌也在尝试,在游戏上,使用迁移学习的技术,让机器变成游戏达人,什么意思?不仅玩一款游戏是达人,可以将模型迁移到别的游戏上,你玩所有游戏都是达人。 除了实验室的成果之外,“迁移学习”在工业界的实际应用上也有非常多的用途,比如说第四范式迁移学习帮助银行做汽车分期的推荐。 汽车分期这类大额的业务,银行在这方面的数据是非常少的,于是我们成功用小额信贷的数据帮助大额的信贷,最后达到效果的提升,这背后就使用了迁移学习。迁移学习可以帮助大家做到一个高频打低频的事情,用数据非常多的业务帮助数据非常少的业务来进行提升,从而打破寡头对数据的垄断。 回到最开始的问题,人工智能这件事是否可怕?我们认为无论是强人工智能,还是超级人工智能,其实并不可怕,可怕的是人工智能带来的红利只能被很少一部分人所获得。汽车的发明让所有人都不用走路了,但是人工智能的发明是否可以让所有人获益? 第四范式觉得,atv,我们应该做的事情是要让人工智能这件事变成所有人都可以获得的一个能力。就像《狮子王》里的一样,我们不希望人工智能被刀巴这样的狮子所主宰,不希望它被垄断,而是希望所有人都可以用上人工智能。第四范式希望随着大数据和机器学习门槛的不断降低,让AI不再是少数人的“特权”,让每个人都能享受到人工智能红利。 这是我今天的分享,谢谢大家! (责任编辑:本港台直播) |