【新智元导读】这篇文章基于Quora的“机器学习板块被阅读最多的作者”,列举了过去30天里回答被阅读最多的10位作者,数据统计至2017年6月25日。 HåkonHapnes Strand,数据科学家 - 264,665阅读,206回答 回答摘选:HåkonHapnes Strand在多大程度上认为在机器学习算法中记住高级公式很重要? 我不认为记住公式很重要。我甚至觉得可能产生相反效果。 如果你了解机器学习算法的工作原理,并且是在低级别上真正理解它,而不仅仅是高级直觉,那么你应该可以自己导出公式。在实践中,记公式是基本不需要做的事情,因为你可以查到它。 记住一个公式可能给你一个错觉,让你以为明白了公式背后的原理。 Roman Trusov,FAIR 2016 实习生 - 254,241阅读,404回答 回答摘选:应该花钱买一个好的GPU学习深入学习吗?(我不是指生产层面的运行。) 如果你是认真想学习DL,那么是的。了解架构或算法与使这些架构或算法正常工作是两个截然不同的事情,获取知识的唯一途径就是自己去实践并分析结果。 如果你考虑购买多个便宜的GPU来学习如何使用它们,最好不要。如果你的框架支持分布式计算,那还好。如果不是,那么到后面会很痛苦。 对于现代架构的训练,CPU无法以任何方式代替GPU。我有一个非常好的CPU,需要几个星期的时间来训练用GPU的话一个晚上就训练完网络。消费级的i5(我也不认为多付点钱买i7是个好主意)甚至更慢。 Zeeshan Zia,计算机视觉与机器学习博士 - 142,140阅读,377回答 回答摘选:怎样为计算机视觉研究科学家的面试做准备? 会有一些编程问题,以及有关计算机视觉和机器学习的基本问题,这部分大约占50%。另外50%就根本没有技术问题。通常情况下,如果你自己编程并定期参加会议,atv直播,那么不需要为这部分做准备。如果真的需要,可以刷几天C ++。 面试官想知道的两件事情是:(1)你可以作为独立研究员工作,(2)你对软件开发工作的预期是否与职位本身相符。 Ian Goodfellow,AI研究科学家- 115,921阅读,143回答 回答摘选:使用GAN生成图像有什么问题或动机? 你可以使用GAN来: 生成模拟训练数据和模拟训练环境 填补缺少的数据 用半监督学习训练分类器(分类器同时从已标记和未标记的数据中学习...,并且使用GAN的话,还同时从完全虚构的数据中学习) 做监督学习,其中监督信号表示多个正确答案中的任何一个都可以接受,而不仅为每个训练示例提供一个具体的回答 用统计生成代替成本高的模拟 从来自生成模型的后验分布取样 学习对其他任务有用的嵌入 Clayton Bingham,Informatics公司数据分析师,神经工程研究员 - 105,861阅读,12回答 回答摘选:机器学习(除了深入学习)有什么趋势? 我不知道有什么趋势,但我知道在主流ML之外一个强大的方法,被证明具有很强的灵活性、可解释性和在VLSI / FPGA硬件中相对容易实现的优势。 Volterra核 理解Volterra序列如何工作的最简单的方法是,它是一系列数字滤波器,用于预估从输入信号到适当的输出的转换。卷积核(滤波器)的形状,时间延迟和数量组成了必须估计的模型的特征,以便对复杂系统的行为进行准确的预测。 Xavier Amatriain,曾经是ML研究员,现在在Quora主管Engineering- 97,947阅读,85回答 回答摘选:什么是训练机器学习模型的最佳实践? 好的指标: 应该容易比较不同的模型 应该尽可能容易理解和解释 最好是跟踪你关心的每个用户细分的指标(例如新用户,旧用户,非常活跃的用户,区域设置....) 在测试集上测量你的指标(不是训练,也不是验证) Chomba Bupe,开发机器学习算法 - 96,608阅读,460回答 回答摘选:在分类方法中,可以添加类和训练样本而无需重新训练所有数据的方法,除了K最近邻法还有哪些? (责任编辑:本港台直播) |