本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

码报:DeepMind表示,AI虽然强大,但仍然难以识别电影中

时间:2017-06-12 01:30来源:668论坛 作者:118KJ 点击:
DeepMind表示,AI虽然强大,但仍然难以识别电影中人物的最基本动作 来源:麻省理工科技评论 原标题:DeepMind表示,AI虽然强大,但仍然难以识别电影中人物的最基本动作 最牛的AI依然难

DeepMind表示,AI虽然强大,但仍然难以识别电影中人物的最基本动作

来源:麻省理工科技评论

原标题:DeepMind表示,AI虽然强大,但仍然难以识别电影中人物的最基本动作

最牛的AI依然难以识别美剧《辛普森一家》中爸爸Homer Simpson的常见行为,比如喝啤酒,吃薯片,吃甜甜圈,打哈欠以及一头栽在地上。

位于伦敦的顶尖AI实验室DeepMind最早提出了这一想法,而这也解释了DeepMind为何要创建包含大量YouTube视频片段的数据集——它希望利用这些数据集来帮助AI识别出远远超出“唔~甜甜圈”或者“我去”(Homer Simpson的口头禅)的人物行为。

码报:DeepMind表示,AI虽然强大,但仍然难以识别电影中

最受Google, Facebook, Amazon等公司青睐的AI算法非深度学习莫属。深度学习算法通过大量的数据训练来帮助机器进行模式和规律识别。这种算法在各种各样的任务中有十分出众的表现,比如帮助Google翻译进行中英文转化,或是自动识别Facebook照片中朋友的脸。

但再高端的深度学习算法也要依赖于大量的高质量数据。为了提升AI识别人类动态行为的能力,DeepMind公布了它的动力学数据集(Kinetics dataset),其中包含了300000个视频片段和400节人类行为的课程。

“现在的AI非常擅长于识别图片中的物体,但仍无法很好地理解视频。”DeepMind的发言人表示,“主要原因是AI研究界内一直缺少一个大型的高质量视频数据库。”

通过Amazon的Mechanical Turk Service,DeepMind招到了网上员工来帮忙识别并标记成千上万YouTube视频中的人物动作。动力学数据集的400节人类行为课程中,每节包含了至少400个视频片段,每个视频片段大概10秒钟,分别来自于不同的Youtube视频。

新推出的动力学数据集将很可能是训练人工智能视频处理能力的新基准。其视频片段和行为课程的数量远远超过了之前的基准--HMDB-51和UCF-101数据集。而且为了保证数据集的多样化,DeepMind不接受来自同一个YouTube视频的多个片段。

与DeepMind同在Alphabet旗下的科技巨头Google可以说有着获得大量训练数据的最好渠道。Alphabet同时还坐拥提供热门网上视频服务的YouTube。但其他公司和独立研究团队只能依赖于公共数据集来训练它们的深度学习算法。

早期动力学数据集的训练和测试让研究者们发现了一些有趣的现象:深度学习算法在给“打网球”,“地上爬的婴儿”,“天气预报”,“切西瓜”和“打保龄球”这些动作分类时达到了80%及以上的准确率。但对于Homer Simpson的动作,比如说扇耳光和用头撞人,以及像“做蛋糕”,“投掷硬币”和“梳理头发”之类的动作,它分类的准确度却降到了20%以下。

“AI在识别吃东西之类的动作时遇到了很大的挑战,因为它无法准确识别出食物——特别是在热狗或是汉堡被吃了一半,atv直播,在视频中显得很小的时候。同样,AI也很难识别出舞蹈动作,因为这些动作都集中在身体的某一部分。还有些动作发生得太快了,只在视频的几帧内可视。”DeepMind的发言人说道。

此外,DeepMind想知道动力学数据集里的性别比例是否均衡,以保证准确的AI训练。之前有案例显示, 如果训练数据不均衡,深度学习算法在识别某些种族的脸时会表现得较差。研究者们也发现这样的算法可以从语言中察觉到性别以及种族歧视。

一项初步研究表明:动力学数据集很均衡。DeepMind的研究者发现在400节行为课程中,开奖,340节是非单一性别参与的,或者无法判断人物性别。那些性别比例失调的课程往往都是“刮胡子”或者“扣篮”(大多数是男性),以及“画眉毛”或者“当啦啦队长”(大多是女性)等之类的YouTube视频。

但即使是性别不平衡的类别也没有带来太多的“分类器偏差”。这意味着,就算一个动作分类中大多都是男性参与者,比如玩扑克或是掷链球,当女性在做同样的动作时,AI识别也没有产生太大偏差。

DeepMind希望外界的研究者能多为动力学数据集提议新的人类行为课程。任何对动力学数据集的提高都能使AI更加擅长于识别不同的动作——不论是最优雅的动作还是愚蠢到让人想说“我去”的瞬间。反之,这也能让新一代的计算机软件和机器人认识到,这些疯狂的人类都在YouTube以及其他视频里干什么。

“让机器理解视频对于AI研究界来说还是一个巨大的挑战,我们都还处于早期研究的阶段。”DeepMind发言人称,“应用到真实世界还要走很长的路,但我们可以看到在医学等领域潜在的机遇,比如,这样的技术可以通过识别超声波心动图来帮助医生诊断心脏病。”

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容