本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

报码:【j2开奖】4位谷歌工程师8分钟视频,带你了解计算机视觉(有字幕)

时间:2017-05-14 23:50来源:本港台现场报码 作者:118开奖 点击:
安妮 编译整理 量子位 报道 | 公众号 QbitAI 到底什么是计算机视觉? 计算机视觉离我们并不遥远。我们经常挂在嘴边的AR、自动驾驶、人脸识别都是计算机视觉的一部分应用。但这样说

  安妮 编译整理

  量子位 报道 | 公众号 QbitAI

  到底什么是计算机视觉?

  计算机视觉离我们并不遥远。我们经常挂在嘴边的AR、自动驾驶、人脸识别都是计算机视觉的一部分应用。但这样说来可能又太宽泛了。量子位找到一个视频,里面是一组来自Google的研究人员,一起谈计算机视觉的历史、现在和将来。

  虽然都属于计算机视觉领域的专家,但这段视频里的被采访者来自谷歌不同的部门:

  Serge Belongie分管移动端视觉;Bill Freeman主要研究PC端视觉;Julian Ibarz和Vincent Vanhoucle这两个小伙,则是机器人技术研究人员。

  视频如下。量子位空耳听译,配好了字幕。

  

  另外,量子位从中截图了一部分内容。

  

报码:【j2开奖】4位谷歌工程师8分钟视频,带你了解计算机视觉(有字幕)

  Serge Belongie认为,计算机视觉主要包括四个方面,概括起来就是四个Re-开头的单词。首先需要让计算机学会识别(Recognition)图像,在此期间需要为计算机输入大量的被标记图像内容。

  

报码:【j2开奖】4位谷歌工程师8分钟视频,带你了解计算机视觉(有字幕)

  之后,需要进行图像重建(Reconstruction),我们输入的图像信息是二维的,但可以利用算法将之变成三维立体图形。

  

报码:【j2开奖】4位谷歌工程师8分钟视频,带你了解计算机视觉(有字幕)

  变成三维模型后,就需要进行图像配准(Registration)了。图像配准是一个比较专业的词汇,是指将不同时间、不同传感器(成像设备)或不同条件下(天候、照度、摄像位置和角度等)获取的两幅或多幅图像进行匹配、叠加的过程。

  Serge认为这其实是教会计算机追踪图像,无论是道路上的行人,还是自动驾驶时追踪的车道、甚至是你自拍时的美颜相机,都是在进行图形配准。

  

报码:【j2开奖】4位谷歌工程师8分钟视频,带你了解计算机视觉(有字幕)

  最后,我们需要对图像进行重组(Reorganization)。在此阶段需要进行大量的无监督学习。就像小孩子在没有被告知的情况下认识这个世界一样,计算机需要在无标记信息的情况下重j2像。

  

报码:【j2开奖】4位谷歌工程师8分钟视频,带你了解计算机视觉(有字幕)

  如同最后Bill Freeman总结的那样,计算机视觉如此迷人就在于它那点让你惊奇的发现。我们看到的计算机眼中的世界,又何尝不是一种动人心魄的美呢。

  【完】

  招聘

  量子位正在招募编辑记者、运营、产品等岗位,工作地点在北京中关村。相关细节,请在公众号对话界面,回复:“招聘”。

  One More Thing…

  今天AI界还有哪些事值得关注?在量子位(QbitAI)公众号对话界面回复“今天”,开奖,看我们全网搜罗的AI行业和研究动态。笔芯~

  另外,atv,欢迎加量子位小助手的微信:qbitbot,如果你研究或者从事AI领域,小助手会把你带入量子位的交流群里。

  追踪人工智能领域最劲内容

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容