我今年年初在硅谷呆了一个月,有一些体会跟大家分享一下。什么是难辨的技术?人工智能属于科学的范畴,科学是离大众很远的。不要说,我们最好的实验室,去评价另外一个实验室的工作,如果只看论文,看公开流通的文章,不是那么容易评论,评估成本是很高的,还要根据多年来两个实验室的交流,以及互相理解的基础,才能评价他们的工作,这对圈内人已经是比较难,更何况现在流动非常大。 我们对科学预设了一个立场,就是客观事实。但很多在市面上评价的东西都是比较主观的,很多科学家、教授、研究员并不在业界的一线,尽管他是全职教授,或者是名牌大学的教授,很多他听到的进展,更多来自于新闻,比如说依图科技的进展,也是看新闻了解到。但新闻可能不是最核心、最领先的一些技术,以这个不是那么严谨的素材做预测和评论的时候,其实是和真相差距比较大的。 科学是一个很严肃的东西,是一个客观存在的东西,但是谈的时候这个误差是比较大的,容易被谈的这个人的身份有一个预设的牵引。 另外一个是,这是一个没有权威的时代。 我在硅谷最好的实验室呆过,他们要了解今天全球最先进的技术在发生什么,也不是了解的那么全面。为什么?因为现在人工智能发展的速度太快了,甚至在各地都有跳跃性的发展。谷歌一个AI的总监不见得理解透他公司的另外一个部门的所有进展,对他们来讲是比较困难的;全球最好的专家要理解全球最好的技术,不见得是全面的。更不用说今天在美国顶级的学术界或者名牌学校里面的老教授,它已经很难很难点评全球最好的技术在发生什么。 这和10年前的学术界是不一样的,学术界3个全球最好的教授,实验室师兄弟几个人凑在一起,差不多把全球的进展,甚至未来3年的进展就都预测了。 这就是一个没有权威的时代,任何一个今天新的技术,有可能是有突破性的社会意义和学术价值。这是我的一个体会。 因为科学很难谈,所以我先从不需要任何专业背景,不需要跨越文化的东西,就是知识的东西,来看看AI今天是一个什么状态。 大家可以看一下这四对图,你看哪一组是同一个人,哪一组不是同一个人。你们通过这个过程来感受一下你到底是怎么认识人的,当你辨别人的时候,到底是看眼睛像不像,还是嘴巴像不像。结论是右下角。 机器很容易找到一张图来迷惑或者超过人的辨识边界。这个话题很有意思,在非常早期的时候,大概3年前,出现了非常重要的边界线。 机器做的识别,跟普通的人作一个识别的基础比较的话,机器的识别能力已经超过人类了,这是一个很重要的界线。很多最基础的功能上机器超过人类,机器就可以替代人从事这部分工作,有太多场合可以替代,比如机器几乎不会存在速度和体力的问题,一秒钟看1个人,还是5秒钟看10亿人机器都可以,很多场合都可以被替代,这是很重要的分界线。 刚识别这四组人像的问题,有的人可能会问,在座的100多位都不认识这几个人,有可能识别不了,大家对陌生人的识别能力下降,可是对熟悉的、我的朋友的辨识,机器不太可能超越我。 我们做了一个实验。我们有一个公安的客户,他在一千万数据库当中,把他女朋友的照片放进去搜索,然后拿出相似的前十名出来,打乱了出来,问他哪个是他女朋友,他辨别不出来的,有可能一个是证件照一个是生活照的原因,有可能因为年龄的原因,也可能有化妆的原因。 所以你非常熟悉的人,比如你女朋友,你不见得比机器更认识你的女朋友,因为光照角度、化妆,人是很容易受主观性的影响。 今天机器做到一个程度,对非常熟悉的人的辨识,机器也可以很稳定的超越人类。再拓展一点,识别人,跟今天在座的观众差不多的体验。到更专业的领域,医学上,一个专家他可能训练了3年或者5年,机器还是可能超越人类。 (责任编辑:本港台直播) |