对TS之前的PreDD阶段的技术验证,一般不会接触到实际代码,算法层面的调研都比较少。一般以黑盒测试和专家验证、第三方机构验证为主。投资人也要熟悉细分领域基本的技术原理和判别指标。 1、关于数据源 人工智能的三要素:算法、计算力、大数据。目前的人工智能算法大都基于深度学习实现,深度学习训练神经网络模型是基于海量的训练集,同时需要训练集中的数据具有多样性和完备性。 随着各种深度学习算法的框架的开源,相信未来的基础框架层的竞争壁垒会越来越低。同时,专有的GPU、FPGA芯片、专用ASIC等也会慢慢攻克本地化、扩展性等问题。 现在的深度神经网络训练大多是监督学习模式,所以需要对每个学习样本依照完成的任务建立相应的监督标签,这是耗时耗人力的工作,海量数据训练集变成了各个厂家比拼的核心资源。 像安防、医疗、金融等领域均拥有海量结构化的带标记的数据,成为了人工智能技术上最先落地的领域。因此,基于行业的独有的海量训练数据集便成为稀缺资源,投资人看项目时,需要仔细甄别、查看数据源的质量、真实性等维度。 2、黑盒测试,应明确测试条件 上文我们谈到,在PreDD阶段,很难接触项目的代码层和过于详细的算法层。那么,一个充分的黑盒测试就显得极其重要。 以往在看项目时,往往会听项目介绍如下: “我们的算法在XX比赛中场景识别准确率达到XX%” “我们的摄像头在多种测试场景下,物体识别准确率达到XX%” “我们的语音识别准确率达到XX%” 如果大家之前做过软件或者硬件测试就会知道一个常识,即一切不谈测试条件的测试结论都是无意义的。不能说项目故意误导,但作为投资人必须要对测试条件进行详细的鉴别。 明确了测试条件后,如果有条件,可以现场进行简单测试。比如,测试远场麦克风阵列,就可以根据麦克风阵列标定的远场距离进行唤醒测试、交互测试等等。 3、投资人应提供独立的测试集,并尽量现场测试 我们在看模式识别的一些项目时,会发现项目核心其实就是分类器。比如,一个医疗人工智能看片项目,我一般会要求项目使用我提供的样片,并且现场上传到项目的SaaS中。可以的话,让机器当场操作,出结论,并与实际结果进行比对,验证分类器的准确率。 如果投资人不提供独立测试样本,一般项目会提供它之前训练好的测试样本进行展示。就好比一个人用准备好的10道题目来证明自己的知识水平,很难讲是真实的水平还是提前背好的。 举例:黑盒测试一个客服机器人 以基于深度学习的XX客服机器人项目举例:通用测试—1000个问题的测试集。
XX项目(80%)在通用测试准确率水平与百小度(86.5%)接近
第三 上下游访谈,要尽量做到充分、客观 上文提到,要对算法模型进行充分的技术验证。那么,如果无法黑盒测试,怎么办?举个例子,如果我们要测试激光雷达,或者ADAS系统。理想中相对充分的测试应该是在一台前装车上进行全工况测试,但现实中行业的发展以及车厂资源很难协调独立第三方测试。那么,这时,一些投资人会更多的通过专家判断、上下游客户访谈等方式进行验证。 1、行业内专家判断要避免单一化,要覆盖全 比如,对无人驾驶项目的判断,既要访谈看好这个方向的专家,也要访谈看空这个方向的专家,多与各领域专家保持沟通合作,充分沟通交换信息,得出结论。 2、上下游合作伙伴要按利害关系,进行访谈 (责任编辑:本港台直播) |