【新智元导读】在业务场景及个人摸索实践中,我们可以如何更好地使用 TensorFlow?以及掌握与运用深度学习、机器学习的正确姿势?带着诸多问题,CSDN “2017 AI 创新者”栏目特别采访了 TensorFlow 项目贡献者——美国 Uptake 数据科学家唐源,一起聊聊深度学习框架的那些事儿。 自 2015 年底开源到如今更快、更灵活、更方便的 1.0 版本正式发布,由 Google 推出的第二代分布式机器学习系统 TensorFlow 一直在为我们带来惊喜,一方面是技术层面持续的迭代演进,从分布式版本、服务框架 TensorFlow Serving、上层封装 TF.Learn 到 Windows 支持、JIT 编译器 XLA、动态计算图框架 Fold 等,以及 Inception Net、SyntaxNet 等数不胜数的经典模型实现,TensorFlow 已然已经成为深度学习框架的事实标准之一。 而另一方面,在开源一年多的时间里,TensorFlow 已经帮助了包括研究人员、工程师、艺术家、学生等在内的诸多用户在各个领域取得了卓越进展,据 Google 官方统计,目前人们已经在 6000 多个在线开放代码存储区中使用 TensorFlow。那么,在业务场景及个人摸索实践中,我们可以如何更好地使用 TensorFlow?以及掌握与运用深度学习、机器学习的正确姿势?带着诸多问题,我们特别采访了 TensorFlow 项目贡献者——美国 Uptake 数据科学家唐源,一起聊聊深度学习框架的那些事儿。
唐源,美国 Uptake 数据科学家,带领团队建立用于多个物联网领域的数据科学引擎进行条件和健康监控,同时建立公司的预测模型引擎,现已被用于航空、能源等大型机械领域。是 TensorFlow 和 DMLC 的成员,TensorFlow、XGBoost、MXNet 等软件的 committer,曾荣获谷歌 Open Source Peer Bonus。在美国宾州州立大学获得荣誉数学学位,曾在本科学习期间成为创业公司 DataNovo 的核心创始成员,研究专利数据挖掘、无关键字现有技术搜索、策略推荐等。GitHub:https://github.com/terrytangyuan 如何走上深度学习框架的开源贡献之路 CSDN:您在大学获得荣誉数学学位,在此期间成为创业公司 DataNovo 核心创始成员,您是怎样开始接触到机器学习和深度学习?有哪些难忘的经历? 唐源:这一切起源于本科与教授做的一个数值分析,接触到了 Matlab 这样的编程语言,由此开始对编程产生了特别浓厚的兴趣,学习各种编程语言,也上过大部分的软件工程的课程,因为在学校读的是宾州州立大学荣誉学院的学位,很多课程都加深了难度,也认识了很多非常聪明和勤奋的同学,在导师 Luen-chau Li 的鼓励下也慢慢开始上了好几门统计、数学、以及计算机研究生的课程,其中第一门就是统计系 Le Bao 老师的研究生难度的数据挖掘课程,开始逐渐接触机器学习,也对这方面产生了浓厚的兴趣,也自己开始跟进了这方面的研究。 DataNovo 是我在上斯坦福公开课的时候和几个小伙伴成立的公司,几个核心成员分布在世界各地,我们有几个经验非常丰富的软件工程师,有着对专利这一块非常有研究的律师,也有拥有沃顿商学院 MBA 的数学家,在凭着我们各自已有的经验基础上,我们通过大量的讨论和调查,一起探索了这个在当时还尚未被挖掘的领域,建立了许多基于机器学习和深度学习比较新颖的应用。比较难忘的是这个摸索的过程,有许多失败也有成功,大家一起用带着各国口音的英语,跨越世界上几个不同的时区,来讨论相关文献和项目进展,一起朝着一个目标努力,是非常有意思的事情,在本科的时候就能够有着这样的创业和合作经验,算是比较有成就感的一件事了。 CSDN:您在什么时候开始接触到开源社区?什么情况下成为了多个深度学习框架的 committer? 唐源:大四的时候在一家创业公司实习,公司对开源的政策特别开放,我们用到了各种各样的开源软件,用的过程中发现各种问题以及对用户体验度有着各种不满,Github 上面有地方可以提交建议,但是项目的管理者太忙,我就干脆自己对源代码进行研究然后提交修改,这样养成了一种习惯,遇到问题的第一反应是自己研究研究代码,然后自己直接去解决问题,独立阅读代码的能力也就这样慢慢培养出来了。很多时候由于对于某个开源软件特别熟悉,经常在做项目中会想到一些有趣的点子来对项目的性能进行改进和功能进行延伸。 (责任编辑:本港台直播) |