陈谔:首先,作为云计算基础服务,永远要提升性能指标,包括吞吐能力,而且性能指标必须平稳,不能有太大的波动,所以我们在块存储、虚拟网络性能方面不断优化,希望也能满足那些极端的情况。我们认为,只要做基础设施,就要不停提升网络 IO性能,就会有很大的效果,这是直接影响客户业务体验的。 还有重要的一块是容器的编排管理,不仅要考虑用户业务在线上怎么做编排管理,还要从研发、测试的角度来考虑怎么利用编排管理的服务来支撑研发的过程。同时 Kubernetes也在不停地发展,包括对两地三中心的支持,我们会保持容器编排管理的持续跟进、优化,使得用户的业务能够在尽可能短的时间内获得到容器云技术最新进展的支持。 Q:您会如何带领研发团队去实现您的目标? 陈谔:我目前带领最多的就是研发工程师。我认为很重要的一点,就是要给大家学习、表现的机会。我们根据研发路线的需求提供一些可以学习的方向,通过学习,还能够筛选出一些能力基础很好、有发展潜力的工程师委以重任。所以技术团队的学习、交流的机会很重要。同时,技术团队的学习和实践有了积淀之后,要推动这些人去分享,不管是技术文章,还是技术课堂,优秀的工程师,无论对内对外都要有表现的机会,让他的价值得到肯定。 另外就是标准化的管理、目标的设定。从技术的角度,我更倾向于设定目标的管理,而不是 KPI的管理。我会告诉大家我们都能认同的目标,比如网络模块应该做到哪些目标,网络抖动可以下降到多少,网络吞吐量可以到多少,让他自己在理解项目整体目标的基础上,再把自己的量化目标定出来。 分享我们做过的一件很有意思的事情: 网易云基础服务(网易蜂巢)最初的版本,从申请资源开始监测,到虚拟机、容器全部启动,大概需要两分半钟。我认为这个速度太慢,当时就提出要求,开奖,希望20秒就能把容器启动搞定。大家觉得这个事情太困难,几乎是不可能完成的。但是接下来分解目标,我们不是制定哪个组几秒钟的 KPI,而是分一些阶段性的目标,先优化到1分钟,再到40秒,再到20秒,让大家看自己的环节,还有哪些潜力可以挖掘,怎么可以一步步地进步,设定一些业界有挑战的、有价值的目标(不是拍脑袋,而是根据业界先进水平或者理论来决定),不断迭代,朝着目标前进。最后,我们确实实现了在20秒左右完成一个容器的建立(除去镜像传输的时间)。在云计算这个复杂系统里面,做到这一点其实是很不容易的。 (责任编辑:本港台直播) |