,对“火箭引擎”做了更改:“计算能力的提高和数据的增多,推动机器学习领域取得了很大的进步,尽管这种观点在学术界并不受欢迎。以造火箭来打个比方……在这个比喻中,火箭引擎便是大型计算机——在百度,也就是我们正在建造的超级计算机——而火箭燃料便是我们拥有的大量数据。 在伦敦深度学习峰会当天早些时候,本文作者对吴恩达进行了采访,吴恩达介绍了深度学习是如何驱动百度的广告服务的。但是,吴恩达也建议说,数据中心的运营方式(也就是谷歌正在探索的)可能更适合。 总之,Corrado 建议,“台式计算机如果有一块高效的 GPU,也能发挥作用”,只要你知道自己想做什么就行了。 但是,你可能需要很多数据 不过, Corrado 也指出,训练深度学习模型确实需要大量的数据。理想情况是,把你能拿到是所有数据都用上。如果他要给决策层提建议,什么时候该使用深度学习,那么主要考虑的两个问题便是: 你需要解决的是不是机器感知的问题; 你是不是拥有大量的数据。 他说:“为了让系统运转,你必须要拥有大量的数据。” 如果没有大量的数据,他的建议是可以去想办法拿到数据。保证在每一个你希望训练的特征上都有不少于 100 次的可训练观察,这是一个很好的开始。 Corrado 表示,花上几个月的时间去对模型进行调整和优化浪费时间,想办法在早期获得更多的训练数据能让你更快地解决问题。 Corrado 还说,他对自己工作的定位不是在建立智能计算机(人工智能)或者打造会学习的计算机(机器学习),而是开发一种能学着变得智能的计算机。
训练这样一个系统需要大量的数据 设想一下,假如有(采用相对统一的数据格式保存的)世界各国地图数据库、各种语言的语料库……会是件非常美好的事情。除了各大巨头开源的和 Github、Reddit、Kaggle 这些比较知名的数据库,新智元根据 Wikipedia 整理了一些开放的大规模(英语)数据库,希望对你有所帮助: 跨学科数据库、搜索引擎: https://www..com/datasets
Open Data Inception(这里有 2500+ 开源接口) 单一数据集和数据库:
https://datamarket.azure.com/
社交网络数据库
(有视觉互动分析的机器学习数据库)
深度学习并不是真的基于大脑 (责任编辑:本港台直播) |