现在,我们和全国百强校中的一半学校签署了战略合作协议,把个性化学习的核心技术打造成讯飞的智学网产品,供全国各地的学生使用。最初讯飞的个性化学习实验在合肥一中开展。实验结果非常好,一个学期的时间,两个实验班同学的数学平均成绩提高了 10%,从全年级二十多个班级中的第 14、15 名,提升到了第 1、2 名。 与此类似的领域还有医疗大数据。这部分业务,我们还处在探索阶段。医疗是一件非常有趣的事情,就像学生学习依赖于有经验的老师来辅导那样,医疗也依赖于有经验的医生的判断。我们通过数据收集、设计人工智能模型,学习有经验的医生的诊断过程,再把诊断过程变得自动化。我们已经取得了一些成果,例如在肺癌检测方面,以前诊断一个病人,一位医生要花费一天的时间看上几百张 CT 片,现在这个过程机器只需要几分钟就可以给出初步结果供医生决策。 ▌智慧城市 加入讯飞后,我的第一个任务就是做智慧城市大数据分析。想让城市的服务变得智慧化需要调用许多大数据,包括交通数据、运营商数据、政府数据、舆情数据等。如何从这些数据中分析出城市的发展状况以及城市内部存在的问题,是我们的核心任务。 其中,在交通领域最基础的工作是跟踪人和车的移动轨迹,研究他们的移动规律。每座城市都可以划分为若干个区域,区域间的人群流动就像城市的血脉。例如,白天人们从 A 区到 B 区上班,晚上人们从 B 区回 A 区居住休息。 从这些移动轨迹中,我们能够分析出人们在哪里住、在哪里工作、去哪里娱乐,能够发现城市的职住比是否平衡,每片区域更应该打造成为商业区、居住区还是工业区。此外,我们还可以据此判断发生拥堵、踩踏事故的几率,并提前 20-40 分钟进行预警。 在判断轨迹的数据来源方面,我们认为,地图导航等 App 的使用频率还是偏低。相较而言,手机运营商的基站产生的数据量更大。城市里,所有人的手机几乎都时刻连接着运营商的基站,不停上报自己的位置。 不过,运营商基站接收到的信号范围半径在 1000-2000 米左右,没有办法精确到城市规划所需的 100 米的范围内。我们为此设计了核心算法,通过高频采样,把不精确的数据尽可能精确起来。现在精确度基本可以达到 50 米左右。 此外,我们还会在互联网加政府服务领域做了一些数据打通的工作。此前政府的信息化系统基本上相当于一座座数据孤岛,距离数据共享、交换还有一段距离,需要一套政府政务数据流通和交换的生态系统。 这里举一个例子说明我们可以做的事情:在安徽芜湖,我们把原来每个部门一个的政府服务办事窗口从 10 个减少到了 2 个统一受理窗口,工作效率不受影响,反而大大提升。这是因为原来公文流转的速度很慢,而现在可以通过我们的政务数据共享交换平台直接交换各部门的数据和审批结果,所有便民便企服务都可以得到及时处理。
「红海」中的新机遇 讯飞作为一家人工智能企业,从 2010 年开始做大数据,对于大数据产业有一些自己的认识。大数据产业可以从四个层面来观察剖析: 一是大数据技术的发展。这里更多是指数据的分析和挖掘技术。在数据统计查询层面,我们已经做到比较成熟的状态,再进一步是数据的理解和搜索,以及对未来态势的预测。层次越往上,做起来越困难,越不太可能用简单的统计分析方法来解决,越会更多地依靠深度学习、机器学习等人工智能相关技术。 二是大数据的生态体系变化。现在,大数据产业内部的分工越来越明确,很多企业都在寻找自己在产业链中的定位,包括讯飞自己。提供数据、提供技术、制定交易策略,还是去做应用,这都是不同的发力方向。讯飞大数据研究院也是讯飞对大数据产业战略思考之后的产物,也就是讯飞要做大数据领域的核心技术研发者。 三是大数据市场的变化。目前,在互联网、市场营销领域,大数据挖掘已成为 「红海」,竞争和技术扩散涉及各个行业。政府、金融、电信等领域也成为大数据应用的重要增长点。而在传统零售、制造、物流等行业,大数据还大有可为,值得在数据采集、处理、存储方面多下功夫。 (责任编辑:本港台直播) |