具体来看,“智能语义拖拽”就是把微信、短信等对话过程中产生的信息进行分析,按照所属直接在地图导航、美食评价和日程日历等产品中使用。 但值得注意的是,锤子最终展现的“智能语义拖拽”是一个一步到位的功能,用户可以直接将一段文字拖入相关App中,而机器会在该过程中分析信息内容、提取核心相关信息、并且让各个App各司其职——快速帮助用户完成目的。 实际上这个过程中,锤子还进一步整合了上次推出的“大爆炸”和“一步”两大功能。 此次智能语义拖拽背后的技术提供方是三角兽科技,这是这家初创公司第二次出现在锤子发布会上,上一次双方合作的产品是“Big Bang”(大爆炸)。 据量子位了解,主打智能语义分析三角兽,在该功能从无到有诞生的过程中,总共向锤子科技派出了3名工程师,共计耗时3个月,最大挑战来自手机场景下的技术方案落地问题——在此之前并没有厂商做出过尝试。 三角兽技术负责人称:智能语义拖拽涉及的是NLP中最核心最具挑战的问题,通俗来讲就是让机器断句,且学会中文语境下的“预感”,进而才能搭建机器学习模型。 不过,在和锤子一起开发“智能语义拖拽”的过程中,最大的挑战来自如何在手机场景下,最低限度降低机器模型对CPU、计算功耗等方面的消耗。 而且作为一个功能型产品,还需要考虑联网和本地两种交替情况下如何保证速度,j2直播,因为反应速度会直接影响用户体验。 “更倾向于合作方是使用网络版的接口,但因为手机涉及用户隐私,或网络情况不佳,就可能需要用到离线版本。 然而紧接着需要解决的问题是离线版本对系统资源的占用,此外运算速度如果太长就会比较伤害用户体验。”三角兽工程师说,同时表示这是最大的考验。 然而,这个最大考验解决后,获利方也将最大化。 在锤子方面的合作实现后,三角兽工程师也坦言,可以无障碍适配到更多的手机产品中。 虽然之前并没有其他手机厂商拥有这样的需求,但在此次坚果Pro的合作中,三角兽和锤子一起完成了从最低配版本的坚果手机,但最高配版本的旗舰机M1L的适配——迁移的成本已经很小了。 这也意味着,一旦其他手机厂商跟进迁移该功能,未来大量涉及不同应用间切换的内容,都将变得 so easy,比如微信中约定吃饭的时间地点,同时将内容拖拽入“日历”、“地图”和“大众点评”等应用中即可。 4)闪念胶囊 “闪念胶囊”是个新鲜事,但伟大的是解决问题的出发点,而非实现的技术难度上。 坦白讲,这只是一次“语音备忘录”和“语音识别”的功能综合,但正如罗永浩所言,这几年来,并没有人为此付出过实际性举动,并且难能可贵的是,锤子将通过开源,让跟多非锤子手机用户也能使用。 这也是锤子AI工具产品思路中的集大成之作。除了语音识别,“闪念胶囊”背后还应用了智能语音拖拽、大爆炸和一步。 在接受量子位的采访中,科大讯飞方面的负责人表示,此次也在“闪念胶囊”中和锤子进行了协作,主要涉及语音识别方面。 与“智能语义拖拽”面临的问题相似,“闪念胶囊”最大的问题是如何在手机设备下实现对资源的合理调用。 如罗永浩发布会上所言,最后锤子和讯飞给出的方案是:首选联网识别,但如果网络情况不佳,则先使用讯飞语音识别本地方案,再在网络情况良好时联网修正。
语音识别和自然语言理解 不难发现,锤子新品发布会上重点推出的工具产品/功能,背后的主要技术是语音识别和自然语言理解及处理,这也是目前人工智能最成熟、进展最快的两大领域,也是中国人工智能公司全球领先的领域。 语音识别方面,从科大讯飞、百度,到搜狗,都已经在大语料数据库的基础上,将语音识别的准确率提升到了97%以上,这在国际公认的标准参数都已然处于领先,并且讯飞还实现了方言领域的高识别率,可以说这是锤子可以实现一系列语音交互为基础的产品的底气所在。 通常情况下,相比键盘为代表的文字输入,语音要高效很多。这也是目前最被看好的新一代人机交互技术,包括亚马逊、谷歌、微软、百度和讯飞在内的公司,都在积极推动语音识别为核心的交互平台的运用,希望自己的语音交互平台,会成为下一个iOS、下一个安卓。 (责任编辑:本港台直播) |