以上这些都很对,但是我为什么需要一个音箱呢?——我同事大博一直很质疑音箱的未来。不过,语音始终要有一个入口,是音箱、电视、冰箱、手机还是车载,还不知道。 智能机器人其实还很笨 36氪的朋友们曾经发过一篇文章《为什么现在的人工智能助理都像人工智障?》,大意是“我不是针对谁,而是在座各位C端智能语音助手,都是垃圾。” 无法否认,现在的语音机器人的智商就跟他们的年龄一样只有几年,木有很智能;产品设计也很不成熟。天猫精灵就经常会出现让我抓狂的时候: 1、同一歌手歌单固定,不会去掉我每次都跳过的歌 《成为乔布斯》一书中提到,苹果iPod Shuffle首次面世时,它的随机播放功能大受欢迎,它却能给人予惊喜,让你不知道下一首播放的是什么,很多人常听的歌单是固定的,所以来来去去都听的前几首,随机播放能让你听到很久没听的歌。 可是天猫精灵好像或者一个没有随机播放的年代。 我每次说:“天猫精灵,来首张敬轩的歌。” 它都会先说:“即将为你播放张敬轩的《吻得太逼真》。” 那是《酷爱》的国语版,我从来不听,但是它每次都会给我播放,atv,于是我每次都要再说:“天猫精灵,下一首。” “即将为你播放张敬轩的《酷爱》。” “天猫精灵,下一首……” 经过多次跟它交互,我发现每次我点张敬轩的歌,先出来都是《断点》、《吻得太逼真》、《酷爱》、《过云雨》、《不吐不快》这几首,有一次我听了超过半小时,终于出现了《披星戴月》、《尘埃落定》等很久没听到的歌…… 2、它不认识我(招牌技能声纹识别功能跟不上) 理论上你给天猫精灵录入了声纹,你问它:“天猫精灵,我是谁”的时候,它会跟你问好,事实上,我经常遇到的反馈是: “对不起,我还不认识你。” 直到我问了三四遍,它才跟我说一句: “你好,小明宝宝。” 3、不够个性化(除了产品逻辑之外,应该也与声纹识别技术未成熟有关) “天猫精灵,来点音乐吧。” “根据你的喜好,为你播放梁静茹的《勇气》。” “蛤?”(懵逼黑人脸)我从来没点过梁静茹的歌,只点过张敬轩、方大同、吴雨霏和Beyond,这智能推荐用的是什么脑回路? 原来是我室友平时在家里让它播的歌,因为她在家时间长,记录的行为数据最多。 我本来以为声纹识别的其中一个作用是,让音箱记住家里每一个人的喜欢,在不同人给它下指令时作出不同的回应,然并卵……看来只有在支付和你问它“我是谁”的时候,它才会启动声纹识别的功能,其他时候,所有与它交互的都被它识别成同一个人。 智能音箱作为家庭设备,不能“认人”其实不太合理,因为家庭至少有两个人,每个人的喜好不同。语音助手本来就主打个性化,识别不出个人,让人略纠结。相反,作为个人设备的iPhone,就只能用机主的声音,才能唤醒,不是谁说一声“Hey,Siri”都能唤醒Siri。 2和3两个问题,我推测都与远场识别和声纹识别目前未完全成熟有关,手机属于近场识别,收音干扰少,Siri被主人唤起不太难。 4、它的英文真的很~~烂 虽然在发布会上阿里就说过天猫精灵英文不好,但我没想到他它不好到这个地步。John Mayer、Taylor这些欧美歌手的歌我已经放弃点了,但是就算华人明星也不行,当我说:“天猫精灵,播一首Beyond的《情人》。” 它的回答永远是:“即将为你播放董贞的《彼岸》……” 印象中,我说了十多次之中,有一次识别成功了,但之后停掉之后,我再也找不回《情人》,那次偶然的成功不知“是缘是情是童真,还是意外”。 虽然这只是语音识别,还没到自然语言处理那一层,已经让我想哭。 语音助手英文烂是个例吗?于是我去试了一下市场上的其他智能语音助手怎么样,我说了两个指令:“播放一首Beyond的《情人》和Play 《Waiting On the World to Change 》of John Mayer”。 以下分别是出门问问、小娜(微软的Cortana)、搜狗听写、微信语音输入、魅族语音助手(科大讯飞提供技术支持)、度秘和手机百度的识别结果。只有出门问问和搜狗听写没有识别出Beyond,至于第二句全英文,则只有小娜和手机百度正确识别。 出门问问 微软小娜 搜狗听写和微信 魅族语音助手(科大讯飞提供支持) 度秘 手机百度 (责任编辑:本港台直播) |