侯晓迪:一方面,新的职业一定会出现,社会会提供给这些人新的就业机会,比如说,自动汽车不需要人来驾驶了,这些人就可以借着物流成本降低的东风来做生意;另一方面,现代社会学习新知识、新技术的门槛越来越低,这些人群完全有可能成为技术工人甚至程序员。最后,自动驾驶系统的换代升级肯定不会是一夜之间完成的事情,市场的转变会是以年为单位的。 Synced:图森在大量使用 labelled data,那么也就意味着还是需要人对数据进行解读,之后进行 supervised learning。这样对于历史数据无法覆盖的危险情况,我们如何保证安全?图森是否在进行 supervised learning 之外的尝试? 侯晓迪:所有的测试数据肯定都是「历史训练数据」无法涵盖的。如何增强模型的泛化能力是机器学习一直以来最核心的问题。近年来深度学习大行其道,确实存在一些急于求成的创业者,一知半解的情况下就拿深度学习说话,给社会一种不靠谱的感觉。但是我们对于纯深度学习的局限性一直很清醒,并且在 end-to-end learning 之外做了很多尝试。比如,我们一直很强调传统的 Bayesian statistics 和深度学习并重的视角来看问题。 机器学习试水商业应用,「曾经训练出来的数据集,可能根本没用。」 机器学习
从年初的围棋大战开始,「机器学习」就注定将成为 2016 年最受关注的话题之一。与此同时,机器学习也从实验室走出来,作为一种更强大的数据分析工具,被快速应用在许多公司的商业决策上。在此次 MIT CHIEF 机器学习论坛(Machine Learning Panel)中,嘉宾们都给出了自己对这一波商业浪潮的独到见解。 微软 Azure 机器学习工作室的高级数据科学家 Wu Tao 首先点出了应用机器学习工具这一趋势的动因:数据的快速增长、计算能力的大幅提升、以及应用门槛的大幅降低。同时,他认为在这一大环境下,小型的公司反而能有更大的优势,因为大公司整合新技术的过程更加烦琐,一定程度上影响商业效率。数据分析解决方案提供者 Tamr 公司的 CEO,Andy Palmer,也分享了他创立 Tamr 的经历和心得,并强调了机器学习工具对商业决策的重要性。 来自麻省理工大学信息与决策系统实验室(LIDS)的高级研究员 Kalyan Veeramachaneni 认为,目前,机器学习预测模型的商业应用,仍有很大的进步空间,因为目前的落地时间慢、行政冗余长。在技术方面,大部分学术上的研究模型都没有在真实的环境下训练过,导致其实际价值非常有限。在会谈过程中,他向台下的观众问道:「在座有多少人训练过数据集?」台下约几十人举手。他随后追问道:「谁训练的模型最终被上线使用?」只有寥寥无几的人响应。 对于提供数据分析服务的初创企业,论坛的建议是:专精于某一个领域,能够帮助公司更快找到客户群。 结束后,Kalyan Veeramachaneni 特别面对机器之心,对此次论坛发言进行了补充。 Kalyan Veeramachaneni Synced:与大部分学术研究不同,您的许多研究项目都更加实际、偏重应用,比如您 2015 年对 MOOC 网站退课率的预测模型研究。是什么让您选择了这些课题? Kalyan:我一直认为,学术界的许多研究灵感都是来源于商业:当旧的技术不能满足市场的时候,学术界就能够把握机会创造新的技术,计算机视觉、机器学习等都是这样的例子。同时,我也觉得,拥有应用价值的研究项目才是更有意义的项目。虽然学术界一直不太强调研究的实际应用,但我觉得这是有价值的。 Synced:您觉得学术研究与商业应用存在脱节的现象吗,对此您有什么看法? Kalyan:我确实认为存在一定程度的脱节,而这种脱节是可以缩小的。比如在麻省理工学院,学术圈与商业的交流非常频繁,我们能够很快地了解到商业企业的最近进展和技术需求,atv,研究成果也能快速地投入商业中使用。所以,第三方机构,比如大学,在缩小这以差距上扮演了很重要的角色。 张首晟——物理学家人工智能风投,当斯坦福与硅谷遇上中国 张首晟 (斯坦福大学教授,丹华资本创始人) (责任编辑:本港台直播) |