类似地,某些领域(金融服务)的企业比其他企业更需要遵守规则。在评估机器学习公司时,我们希望了解企业现在和未来有可能面临的监管阻力,以及他们的应对方案。 5. 部署的可扩展性 机器学习引导的软件公司的扩张速度可能因为难于部署而受到限制。 数据集成要求可能很广泛。合并、集成和净化相互隔离的客户数据集,会限制实现价值的时间。 软件公司对资源的需求可能很大,限制了获取新客户和提升利润率的潜力。我们沟通过的很多机器学习公司都有三分之一的团队成员参与部署。其中一家对我们说,由于每个客户都有人员要求,所以“即便我们有更多订单也处理不过来”。 虽然深入的客户关系可以提升客户粘性,带来更多向上销售机会,但能够将部署要求降到最低、能够自动完成数据收集、数据协调和部署过程的机器学习公司,可以更快地做大规模。 防御力
随着竞争者的涌入,这些机器学习驱动的公司能够在多大程度上守护住自己创造的价值呢?在防御力上,我们主要看重六点:与行业巨头间的距离、领域复杂度和相关专业度、通过数据创造网络效应的能力、专有算法、吸引高质量人才的能力以及运用资本武器的能力。 1. 与行业巨头间的距离 在领域内,谷歌、亚马逊、IBM和微软(以下用GAIM简称)都提供了基于云的机器学习服务,这些服务包括广义上的计算机视觉、语音及文本处理,而且其能力和规模、范围还会继续扩张。最近,谷歌在计算机视觉方面的技术能力已经扩展到了视频范畴,并且已经开放了其能够提供视频实体识别、搜索和编目能力的视频智能API。在拥有Deep Mind强力支持的情况下,谷歌先进的机器学习技术最终将能够覆盖到一个非常宽广的服务范围。 GAIM高表现、低成本的通用型机器学习服务将会压倒一切——除了一部分在某些特定领域最有经验、做得最好的竞争者。 如果一家公司提供的机器学习服务远离GAIM的核心竞争区域,那么它们也将拥有更强的“防御力”。判断这一距离的标准,一是领域的垂直度,二是广义计算机视觉与计算机语言领域之外的技术发展情况——在实际情况中,这意味着其他公司提供的应该是不同于GAIM通用、基础型解决方案的特定功能、特定垂直领域型解决方案。目前,四巨头在垂直领域的野心还主要限于医疗健康以及交通运输,尽管它们未来同样可能试水其他与自身业务相关的领域。 从手工业到法律业、农业,早期的机器学习公司有机会向前推进乃至重塑这些行业的形态。GAIM目前对它们并不%感兴趣,而要与其他人竞争,它们也缺少足够的数据优势与领域专长。 2. 领域复杂度 领域和行业上的距离能将同GAIM之间的竞争最小化,而机器学习公司在其所属领域内的动力则能够在商业竞争中为自己提供进一步的保护。 复杂的领域,包括那些需要大量的行业专业知识、要求精细化管理或者是面临极其复杂技术挑战的领域。选择复杂的领域也意味着业务上要扛起更重的负担。路途艰险,但一旦真的上了岸,这些公司就能占据更为有利的防御位置。最吸引人的生意,总是那些处于有一定复杂度的领域,同时又有能力把这些困难搞定的。 3. 通过数据创造网络效应的能力 能够获取个人的、领域专属性数据集的公司将会拥有更多的训练材料来对自己的机器学习算法进行提升——而这通常会让竞争者付出代价。网络效应就是如此发挥作用:你能拴住的客户越多,公司的产品就越好,公司的产品越好,就越能拴住更多的用户,获得越多的专有数据。一家在金融服务行业提供欺诈检测的公司将能够从自己每一名新客户身上获取新的、非公共性的数据。 显而易见,一家机器学习公司为了训练自己的算法只需要使用公司的私人数据,而不需要拥有它们。如今,有了通往数据的渠道,那些保有数据的大佬们以前在数据上的优势已经在很大程度上被抵消了。 网络效果的潜力,还可能会造成一种二阶效果——早期的机器学习公司可能会将数据的获取渠道看得比短期利益更加重要。考虑到早期客户数据的价值,机器学习公司可能会投放免费软件,或是在一定程度上缩减在早期用户身上的收益。 4. 专有算法 (责任编辑:本港台直播) |