不过,虽然我们的核心技术已经应用到了各个领域,我们仍始终认为,让技术转化为实际生产力是一个非常漫长的过程。即便技术登峰造极,产品如果不接地气,市场仍然不会去买单。在我们的办公园区里,有一座名为 「顶天立地」 的雕塑,寓意就是提醒讯飞人:技术要顶天,应用要落地。因此,我们认为,即使技术走到了 90% 或 99% 那一步,如果还没有得到市场的认可,我们也只是刚刚起步。
大数据的变现通路 讯飞基于自有大数据或者合作伙伴的大数据,重点在精准营销、个性化学习、智慧城市三个方向做了应用落地和技术研发。 ▌精准营销 在精准营销领域,讯飞最大的优势是有自己独一无二的大数据来源。讯飞的人工智能开放平台向所有有兴趣做人工智能应用的合作伙伴开放人工智能能力,同时通过这些合作伙伴手机到了大量的用户行为数据。讯飞现在有 20 万家合作伙伴,领域从手机输入法、手机语音助手,到导航 App 里林志玲、郭德纲的语音,还有购物 App 里的语音搜索,讯飞已经构建起一个人工智能和语音服务的生态圈。 例如,目前市面上能够买到的和人对话的机器人、儿童玩具或手机 App,80% 以上都使用了讯飞的人工智能云服务。目前平台上有 8.9 亿独立用户,包括讯飞输入法的 3.6 亿用户,每天产生 30 亿次交互。因此讯飞也建设了大数据能力平台 Odeon ,用来存储、处理这些大数据。Odeon 自 2010 年上线以来,目前集群已有 400 余台,日均新增数据达到 100TB。这是讯飞自有大数据宝藏的最主要源泉。 以平台上的大数据为基础,我们综合运用人工智能和大数据技术,从人生阶段、行业、购物偏好、媒介偏好等维度,用 1700 个子标签对这些用户作出区分。例如,声纹识别技术对用户的性别划分、年龄划分很有帮助,如果仅靠传统的用户行为数据或日志数据,我们是没有办法得到这些精准结论的。 用户画像完成后,第一件可以做的事情就是精准营销。精准营销的核心价值在于对用户的分析、挖掘以及引导,而导流的最终体现则是用户对广告的点击。这已是一条比较成熟的数据变现路径。 在广告形式上,讯飞也做了一些创新探索。例如交互式广告,用户对着手机喊出相应的品牌,即可赢得一些奖励。现在,我们不仅对内部的讯飞广告平台提供服务,也对有精准营销需求的第三方提供数据交换和查询服务。这项业务每年可以做到数亿流水。 另一部分精准营销的工作内容围绕推荐付费内容展开,包括推荐付费音乐、铃声、阅读和一些视频内容。根据个性化推荐算法,我们把不同的付费内容匹配给不同用户,再进行一些商业化运作。 ▌个性化学习 在教育领域,「因材施教」 的道理听上去很简单,但背后需要非常复杂的脑力劳动来支撑。老师需要知道学生擅长什么,什么相对而言比较薄弱,了解程度需要具体到知识点层面,比如,某位同学擅长一元二次方程,但平面几何稍差一些,题目设置的难度和学生需要投入的精力,在这些知识点间都要有所不同。 通常,老师了解学生学习情况的方式是上课提问,或者看作业错题和考试成绩。如果用机器来完成这一步,就需要让机器也能够 能看会写、能听会说。讯飞目前的做法是用高速扫描仪,把学生日常作业、随堂检测、考试答题卡等全部扫描进去,把题目和答案转化成一个个对知识薄弱点的判断数据,再把这些数据集合起来形成教育大数据,有针对性地向学生推荐相应的课程和题目。 这其中,关键的两个步骤分别是:利用人工智能的手段,搜集真正的教育过程数据;把教育过程数据转化成为学生学习过程中有的放矢的针对性辅导。按照中国目前的经济发展水平,我们不可能要求所有学校学生的学习过程全部上网,所以我们提供了上述解决方案——高速扫描手写作业和试卷。 我们组建了一支数十人的团队来完成这部分工作。项目筹备期比较久,直到 2014、2015 年时,我们才在技术层面取得突破。在评阅英语作文、语文作文这一块,我们曾面临很多问题。例如,在英文作文中出现了汉语拼音怎么办?从文字识别到自动评分,直播,这个过程花费了一些时间才得以完成。这两年学生参加四六级考试,作文部分的阅卷工作很可能就是由讯飞的机器来完成的。我们在 2016 年时做过验证,机器阅卷判定的分数,和专家组的打分结果不相上下。 (责任编辑:本港台直播) |