这样一个分法描述了今天主流发展中的突破点。比如从2012年ImageNet的发展上看,图片的识别开始有了很大的提升。从这两天微软重磅的讲语音识别已经真正超过了人,这是一个识别领域的进展。因此在学术领域,我觉得做决策、做识别和做生成都是同等重要的,我想给大家一个判断,在这三个领域里,如果作为一个企业,把它变成市场价值,识别和生成本身很难背后有一个强的商业模式,而只有做决策才能变成商业智能里一个核心的过程,这是我想给大家分享的。 投资界有的时候说,谁做的图片识别特别好,做个语音识别特别好,就畅想在未来有什么样的价值,这是很危险的事情。所以我们看到很多做图像和做语音识别的公司拿了很好的技术或成果推向市场后,并没有找到很好的应用场景,或者做一个安防,并不能创造一些直接的价值,就把它给卖掉了,或者做一些简单的to B的 License fee,所以,这里面最重要的一点,是机器能够帮助我们做决策,这个事情是三个里面的商业价值是最大的。 刚才我们提到有几个明显的概念,大家已经听到烂熟。像大数据、云计算和人工智能。其实,我们做搜索、做输入法都会用到这里面的核心技术,只是很难总结说这个事。简单讲搜狗这样的状态,我会进入下面对未来的思考。从搜狗现在而言,我们已经有巨大的用户规模,我们的用户规模在PC里是在中国排第一名的。在无线领域里,大家可能想不到搜狗输入法APP这一款产品是在整个APP用户规模里排第三,排第一第二的是微信和QQ。 为什么提这样一些概念呢?是因为我们的用户规模虽然大,但是输入法本身不是一个做决策的机器。因为当用户想输入什么东西的时候它就会给你精确的结果。如果你输入腾讯,它一定不会给你出阿里。你输入淘宝不会给你出京东。对于输入法而言,它是精确的把用户的需求做一个翻译的过程,所以它不是决策的机器,所以商业价值低。但搜索引擎不是,它本身是根据你的关键词或概念后帮你做分析判断。所以,PC上我们排第三名的位置,在无线里顺利达到了第二,现在有36%的市场份额。 现在大家数互联网上盈利的公司有多少呢?如果我们把游戏公司剖掉就知道有BAT、360、搜狗,再数出几家盈利的公司都会很困难。我们在去年靠搜索引擎创造了1亿多美金的利润。因此,在今天的前提条件讲完后,我想说明什么事?搜索本身是商业模式极好的互联网应用,最近5月份出了百度这个事以后,一提搜索广告大家就有负面的想法,其实广告本身没有错误,Google也在广告上用得很好。所以,既要商业模式好又要快速盈利,这件事情是搜索重要的意义。 今天我想和大家分享的第一个观点:搜索的未来就会成为人工智能未来的明珠,这是我的核心论点。所以,今天的搜索已经用了人工智能,未来也是核心,怎么理解这件事情?大家会问,搜索的未来是什么,人工智能的未来是什么,怎么就明珠了?我们以前讲到AlphaGo是有一些智能,但它是偏专项的,而且是和自然语言没有关系的。另外我们看到的图灵测试是对智能方面的理解,今天我不给大家展开这样一个概念,我更多想说,从难度上人工智能要解决三个事情:一是语音,二是图像,三是自然语言的处理。哪个最难?我们以前发现发展的最早的是自然语言的处理,语音和图像很长时间本身的处理很差,所以我们觉得自然语言简单一些,特别是符号主义的情况下,觉得语音图像更难。但最近几年人工智能发展,我们很好的解决了语音和图像的问题,它的识别率和生成能力得到了提高,但自然语言的处理发展的反而更慢。是因为我们看到,深度学习带来的对一种感性的理解已经到了一个高度,但反过来由于自然语言本身中间对人的概念符号怎样和深度学习结合是更难的事情。因此,这件事情的突破会比语音和图像更难。 简单讲搜索的未来是什么?我先做一个简单的回答,就是问答机器人。搜索未来是做问答的。怎么看这件事情?今天我们的搜索是从关键词到10条的搜索结果。我曾经观察过,在1999年到2000年的时候,搜索刚刚诞生,这个时候大家用搜索的用法不是输入关键词的,我当时在chinaRen曾经做了一个孙悟空搜索之后,我找了第一个用户来用,我说这是一个搜索引擎,你试着在这上面提问。他问的第一个问题,“我今天美吗?”我立刻就觉得很崩溃。在我心中已经觉得它是一个检索的系统。所以,经过好多年的教育后,今天的用户已经懂得了用关键词来寻找他需要的答案。有一个数据统计,关键词之外大家会加空格把它变成一个符合的搜索,单关键词的搜索量占整个搜索的97%,只有3%的搜索是在关键词间加了空格,所以在座的各位可能更多是这种高知群体,我们不管对搜索技术有多么理解,但是我们自己已经懂得怎样去描述自己的这样一个表达,用关键词+空格的形式来翻译自己的想法获得答案。 (责任编辑:本港台直播) |