唐源:开源往往是战略上的决定,往往是和商业利益上是没有冲突的,我之前也提到过,开源一个项目可以为这个项目节省不少成本,也可以给这个公司节省招聘合适人才所需要的开支,因为你可以招到已经熟悉公司所使用技术的员工,当员工加入公司时,不需要再花时间和精力来进行培训了。 机器之心:另外一些人认为公司如 Google、Facebook 和微软做开源的目的是为了垄断行业,你觉得这些担忧是有必要的吗?我们应该如何应对呢? 唐源:我觉得这个没有必要担心,技术的更新换代太快了,可能今天比较火的技术和开源项目,明天就因为某个原因停止维护以及失去竞争力了,比如说以前比较火的 DeepLearning4J,因为有着比如像 MXNet 的 Scala 接口这样的竞争者,有着更好的性能也有着更了解用户需求的 DMLC 成员的维护,相信现在已经很难再有竞争力了。我们不应该担心这些,我之前也稍微提到的一点就是大家喜欢比较不同的框架,从而不断学习这些不同来改进自己的产品让它更有竞争力,互相竞争是很好的一种现象。我们能做到的就是使用自己喜欢的软件,来达到自己的研究和工作的需求,与时俱进。 机器之心:谷歌、Facebook 还有 OpenAI 这些组织做了很多开源,你们也在做,你们认为开源对人工智能技术和社区的发展有怎样的作用? 唐源:开源可以让人工智能的研究的结果更有重现性然后能够更方便地让研究学者们分享研究结果。比如说我之前谈到的 TF.Learn,谷歌最近甚至最近的一篇论文是使用它来实现的,算法的实现也成为了 TF.Learn 里面的一个 Estimator,这样其它的业界人士也能直接使用到他们的工作研究当中,论文的结果也能很容易地再次得到。这些公司的开源项目都让大家有更多的学习资源,让大家有更好的工具来帮助自己的学习,工作,以及研究。这些开源项目也给了全世界各地的朋友互相交流,学习,开奖,以及一起开发产品的机会,我觉得是特别宝贵的,在芝加哥我们经常举行线下的见面会来进行交流,这样可以极大地扩展自己的视野,也认识到了一群志同道合的朋友。 机器之心:谷歌给你颁发了 Open Source Peer 奖,能给大家介绍一下这个奖对你的意义吗?你接下来打算做什么? 唐源:这个奖首先是由谷歌内部员工提名推荐,然后再经过内部审核和讨论得到最后的获奖人名单的,我通过持续的贡献得到了他们的注意以及肯定,这是对我的一个很大的鼓励以及对我的贡献的认可。首先我会继续活跃在这个社区中,维护和继续贡献参与的软件,帮助大家解答使用软件时遇到的各种问题。很多时候在 Github Issues 和 StackOverflow 上会发现许多有趣的主意或者是某个人的问题和回答会激发新的灵感。然后我也一直在观察这一行的需求,其实有很多东西都是可以做的。我比较感兴趣的是那种能够让大家工作更有效率,让工作更不那么重复和繁琐的项目。 关于 DMLC
机器之心:在你眼中,DMLC 是一个什么样的组织?是什么样的契机加入了 DMLC? 唐源:简单来说,DMLC 是为了帮助大家更方便使用一些最新的算法和技术,降低大家进入这一行的门槛。我们想把最先进的技术带给大家,这样感兴趣的朋友可以不必再花费时间来重新实现这些技术,从而可以直接应用这些技术到他们的研究和工作当中,集中精力在已有的技术上进行突破。我们觉得好的东西应该要分享给大家,这样可以提高大家的效率,也可以加快研究领域上的突破。我最先开始是一直在改进和延伸 DMLC 的 XGBoost 项目,比如说给 Python 包做了许多小的功能上的延伸,其中有不少的需求都是来自现在比较火的数据科学竞赛 Kaggle 用户,一些 DMLC 成员经常参加 Kaggle 里面的论坛,来帮助大家更好的使用 XGBoost 来满足他们各种创新的建模需求。在天奇的邀请下,我成为 XGBoost 的 committer,然后也就自然而然地花更多的时间在维护这个项目,后来又参与了 MXNet 的 Scala 接口的建设。 (责任编辑:本港台直播) |