本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

报码:【j2开奖】谷歌深度学习四大教训:应用、系统、数据及原理(附数据集列表)(2)

时间:2016-10-29 08:34来源:香港现场开奖 作者:118开奖 点击:
,对“火箭引擎”做了更改:“ 计算能力的提高和数据的增多,推动机器学习领域取得了很大的进步 ,尽管这种观点在学术界并不受欢迎。以造火箭来打

  ,对“火箭引擎”做了更改:“计算能力的提高和数据的增多,推动机器学习领域取得了很大的进步,尽管这种观点在学术界并不受欢迎。以造火箭来打个比方……在这个比喻中,火箭引擎便是大型计算机——在百度,也就是我们正在建造的超级计算机——而火箭燃料便是我们拥有的大量数据。

  在伦敦深度学习峰会当天早些时候,本文作者对吴恩达进行了采访,吴恩达介绍了深度学习是如何驱动百度的广告服务的。但是,吴恩达也建议说,数据中心的运营方式(也就是谷歌正在探索的)可能更适合。

  总之,Corrado 建议,“台式计算机如果有一块高效的 GPU,也能发挥作用”,只要你知道自己想做什么就行了。

  但是,你可能需要很多数据

  不过, Corrado 也指出,训练深度学习模型确实需要大量的数据。理想情况是,把你能拿到是所有数据都用上。如果他要给决策层提建议,什么时候该使用深度学习,那么主要考虑的两个问题便是:

你需要解决的是不是机器感知的问题;

你是不是拥有大量的数据。

  他说:“为了让系统运转,你必须要拥有大量的数据。” 如果没有大量的数据,他的建议是可以去想办法拿到数据。保证在每一个你希望训练的特征上都有不少于 100 次的可训练观察,这是一个很好的开始。

  Corrado 表示,花上几个月的时间去对模型进行调整和优化浪费时间,想办法在早期获得更多的训练数据能让你更快地解决问题

  Corrado 还说,他对自己工作的定位不是在建立智能计算机(人工智能)或者打造会学习的计算机(机器学习),而是开发一种能学着变得智能的计算机。

  

报码:【j2开奖】谷歌深度学习四大教训:应用、系统、数据及原理(附数据集列表)

  训练这样一个系统需要大量的数据

  设想一下,假如有(采用相对统一的数据格式保存的)世界各国地图数据库、各种语言的语料库……会是件非常美好的事情。除了各大巨头开源的和 Github、Reddit、Kaggle 这些比较知名的数据库,新智元根据 Wikipedia 整理了一些开放的大规模(英语)数据库,希望对你有所帮助:

  跨学科数据库、搜索引擎:

https://www..com/datasets

Open Data Inception(这里有 2500+ 开源接口)

  单一数据集和数据库

https://datamarket.azure.com/

  社交网络数据库

(有视觉互动分析的机器学习数据库)

  深度学习并不是真的基于大脑

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容