例如,atv直播,目前市面上能够买到的和人对话的机器人、儿童玩具或手机 App,80% 以上都使用了讯飞的人工智能云服务。目前平台上有 8.9 亿独立用户,包括讯飞输入法的 3.6 亿用户,每天产生 30 亿次交互。因此讯飞也建设了大数据能力平台 Odeon ,用来存储、处理这些大数据。Odeon 自 2010 年上线以来,目前集群已有 400 余台,日均新增数据达到 100TB。这是讯飞自有大数据宝藏的最主要源泉。 以平台上的大数据为基础,我们综合运用人工智能和大数据技术,从人生阶段、行业、购物偏好、媒介偏好等维度,用 1700 个子标签对这些用户作出区分。例如,声纹识别技术对用户的性别划分、年龄划分很有帮助,直播,如果仅靠传统的用户行为数据或日志数据,我们是没有办法得到这些精准结论的。 用户画像完成后,第一件可以做的事情就是精准营销。精准营销的核心价值在于对用户的分析、挖掘以及引导,而导流的最终体现则是用户对广告的点击。这已是一条比较成熟的数据变现路径。 在广告形式上,讯飞也做了一些创新探索。例如交互式广告,用户对着手机喊出相应的品牌,即可赢得一些奖励。现在,我们不仅对内部的讯飞广告平台提供服务,也对有精准营销需求的第三方提供数据交换和查询服务。这项业务每年可以做到数亿流水。 另一部分精准营销的工作内容围绕推荐付费内容展开,包括推荐付费音乐、铃声、阅读和一些视频内容。根据个性化推荐算法,我们把不同的付费内容匹配给不同用户,再进行一些商业化运作。 个性化学习 在教育领域,「因材施教」 的道理听上去很简单,但背后需要非常复杂的脑力劳动来支撑。老师需要知道学生擅长什么,什么相对而言比较薄弱,了解程度需要具体到知识点层面,比如,某位同学擅长一元二次方程,但平面几何稍差一些,题目设置的难度和学生需要投入的精力,在这些知识点间都要有所不同。 通常,老师了解学生学习情况的方式是上课提问,或者看作业错题和考试成绩。如果用机器来完成这一步,就需要让机器也能够 能看会写、能听会说。讯飞目前的做法是用高速扫描仪,把学生日常作业、随堂检测、考试答题卡等全部扫描进去,把题目和答案转化成一个个对知识薄弱点的判断数据,再把这些数据集合起来形成教育大数据,有针对性地向学生推荐相应的课程和题目。 这其中,关键的两个步骤分别是:利用人工智能的手段,搜集真正的教育过程数据;把教育过程数据转化成为学生学习过程中有的放矢的针对性辅导。按照中国目前的经济发展水平,我们不可能要求所有学校学生的学习过程全部上网,所以我们提供了上述解决方案——高速扫描手写作业和试卷。 我们组建了一支数十人的团队来完成这部分工作。项目筹备期比较久,直到 2014、2015 年时,我们才在技术层面取得突破。在评阅英语作文、语文作文这一块,我们曾面临很多问题。例如,在英文作文中出现了汉语拼音怎么办?从文字识别到自动评分,这个过程花费了一些时间才得以完成。这两年学生参加四六级考试,作文部分的阅卷工作很可能就是由讯飞的机器来完成的。我们在 2016 年时做过验证,机器阅卷判定的分数,和专家组的打分结果不相上下。 现在,我们和全国百强校中的一半学校签署了战略合作协议,把个性化学习的核心技术打造成讯飞的智学网产品,供全国各地的学生使用。最初讯飞的个性化学习实验在合肥一中开展。实验结果非常好,一个学期的时间,两个实验班同学的数学平均成绩提高了 10%,从全年级二十多个班级中的第 14、15 名,提升到了第 1、2 名。 与此类似的领域还有医疗大数据。这部分业务,我们还处在探索阶段。医疗是一件非常有趣的事情,就像学生学习依赖于有经验的老师来辅导那样,医疗也依赖于有经验的医生的判断。我们通过数据收集、设计人工智能模型,学习有经验的医生的诊断过程,再把诊断过程变得自动化。我们已经取得了一些成果,例如在肺癌检测方面,以前诊断一个病人,一位医生要花费一天的时间看上几百张 CT 片,现在这个过程机器只需要几分钟就可以给出初步结果供医生决策。 智慧城市 (责任编辑:本港台直播) |