自然语言处理:现在你笨拙的 Google Now 和 Siri 可能还无法胜任,但是在研究实验室里,在将声音转化成文本方面,我们已经有了靠谱的技术。在人脸识别方面,训练自然语言处理(NLP)算法(来自于智能手机和机器人程序的交互界面以及 Amazon Alexa/Google Home 音箱)的数据爆发式增长也刺激了这场革新。在 2016 年,微软的技术在语音识别能力方面已经击败了人类对照组。在此之后不久,Google 展示了将八对语言组合进行实时翻译的新方法,这也意味着这些新技术已经轻轻松松嗖地一声超过了(大部分)人类的翻译能力。
面部识别问题已经被解决了。在 2015 年 6 月份,Facebook 的人工智能负责人 Yann LeCun 宣称 Facebook 的算法在识别从 Flickr 获得的 40000 张图片中的人脸时正确率达到 83%。有趣的是,有时候图片中并不需要出现人脸——因为算法在拥有足够多关于用户的数据时,能够使用其他类似于衣着之类的线索来识别用户(「Mark 似乎总穿灰色的 T 恤衫」)。随着照片激增,Facebook 和 Google 也随着用户在图片中标记他们的朋友而获得持续的反馈,基于图片的识别技术正在持续进步。在拥有视频、每个用户的习惯、着装和定位的历史记录的情况下,算法将在识别谁是谁这方面轻松超越人类。(还记得上次你挣扎着辨认某个你几年没见的人吗?)而也许在解读视觉线索上,算法也比你厉害。
大海捞针 人工智能系统能够从原始数据中推断出更高水平的概念(「特征」)。例如,人脸就是一个从构成视频的原始像素中推断出来的特征。这实质上使得所有视频和所有声音都变成了可搜索的文件。clarify.io 公司就是提供该种服务的。
但是人工智能不仅局限在帮助人类进行搜索,它还能为你完成所有可能的搜索并得出更高水平的「特征」:有趣的模式或是异常事件。 人工智能也通过对数据集加上常见的识别符来对许多可获得的数据资源进行此种搜索。所以你看到的不仅是「视频里的一张人脸」,也是这张脸后面的人名,是这个人在网络上留下的蛛丝马迹(包括所有其他这张脸曾经出现过的地方、所有浏览活动、所有通信、所有线上社交过程中的观点等)和所有其他可能获得的数据集。 这些人工智能系统将持续进步,并且每次经过改进的版本将对原始数据重新进行处理。比如说英国警方用一个算法对上周所有公共闭路电视的录像进行了处理来确认一个罪犯的长相。今天的算法可能找不到,但是未来的版本就可以。 所以,这些进步意味着什么呢? 对商业的意义 广告商、保险公司、零售商和银行将尽情享受这些新数据,就像他们目前为止已经对其他互联网数据做的那样。他们的目标依然是对「你」建立起一个充满细节的用户画像,以卖给你更多东西并量化你带来的风险或责任。 无迹可寻的监控加上一直在进步的人工智能系统可以提供: 你的经济社会地位:你居住的地点、你工作的地点和收入、你是否要送小孩上学、你跟谁以何种频率到哪里消遣。 你的购物习惯:你到哪里购物、你穿什么衣服、你的朋友穿什么衣服、你去工作的时候必须穿什么衣服。 你的健康:你有多活跃、你是否吸烟或喝酒、你光顾或预定哪种餐馆、你去看过多少医生。
在更宏观的层面上来讲,这也带来一些有趣的进行预测的机会: 如果半打价值 100 美金的静态摄像头就能告诉你有关在今年伦敦时尚街区 Shoreditch 里所有人的着装信息,如果你能够通过社交网络和街拍的照片追踪一股潮流从刚开始到变成爆款的过程,这对将对时尚产业产生什么影响? — 引自 Benedict Evans 的文章《照相机、电子商务与机器学习(Cameras, ecommerce and machine learning)》 (责任编辑:本港台直播) |