智东西(公众号:zhidxcom) 文 | 四月 导语:当人工智能概念被消费过度,atv,深度学习算法优势逐渐消融,讲故事和吹数据在VC面前不再管用,由学术精英们打造的明星初创下一步该往哪走? 谈及国内计算机视觉创业,“一桶筐汤”(依图、格灵深瞳、旷视、商汤)是绕不开的资本宠儿,其中格灵深瞳在产品风格上特点显著。因其创始人赵勇偏向计算机视觉硬件方向的博士背景,使得这家公司更喜欢尝试硬件上的创新,从而也适时地避开了当下算法优势同质化的困境。 但技术型公司在早期还需依靠资本支持。2016年底,商汤、Face++均完成了上亿美元融资得以充足弹药,而并列其中的格灵深瞳似乎没啥动静,不免引起吃瓜群众的担忧。上半年提到的秘密武器“人眼摄像机”也不知落地了没有?带着些许疑惑和好奇心,智东西来到位于颐和园北面的格灵深瞳。
虽然早有耳闻格灵深瞳别具一格的办公环境,但在寒冬赶至这座古院中的公司仍不少惊喜。院中的湖面已结出薄冰,一只富态的喵爷正来回踱步,老树枯藤显得静谧而安详。听赵勇介绍,atv,因团队规模扩充,年后公司要搬进奥北科技园。真是可惜了窗外的这幅水墨画。大概是受益于复旦大学的人文熏陶,赵勇给人的感觉温文儒雅,同时影响到格灵深瞳这家公司,幽深的庭院,韵味的门匾,古色古香,少了一丝商业味道。 在近两小时的对话中,赵勇从软硬件产品布局切入,深入分析了公司的下一步具体战略。早期的试探和走过弯路之后,格灵深瞳借硬件优势辅以大数据平台战法,跃跃欲试要在安防领域大干一场。同时身兼驭势科技合伙人的赵勇也披露了两家公司背后的深厚渊源。此外,赵勇也分享了对于计算机视觉在金融领域的应用考量,这同时也是格灵深瞳现阶段没有涉足两块市场的重要原因。在办公室内穿行的机器人小车则揭开了另一项产品的神秘面纱。 再回归到创业这个话题上。布朗大学计算机工程系求学,供职于谷歌资深研究员,前后十年的美国生活,是什么让赵勇毅然回国创业?除了满腔热血,我们还看到了一份更深切的情怀。 一、院里除了美景,还有四处的“人眼相机”
如果说门匾题词的招牌还让人对这家公司有些摸不着头脑,那么庭院里四处分设的“怪异摄像头”则有力地强调了他们的核心实力。据赵勇介绍,这是公司将不久后正式发货的产品“人眼相机”。该相机模块采用像素动态瞬时分配的专利技术,可实现50米半径范围内清晰识别人脸,100米内看清全身特征,200米内看清车辆信息;视场角达到80°;可以瞬间将局部画面的有效像素提升百倍以上(普通高清1080P摄像头200万像素),使整体画面达到两亿等效像素。 耳听为虚,眼见为实际。在庭院中走过一圈中后,赵勇带领笔者回到室内的测试间,站在一块大屏幕和普通摄像头前进行人脸比对测试。此时,庭院中的人眼相机已将远距离捕捉到的图像信息存储在云端后台,测试间的普通摄像头通过调用数据进行实时人像比对,在我尝试遮脸、侧脸、做鬼脸等非配合条件下测试后,后台仍能准确地找出我此前的图像,并且识别比对都是实时完成。
在测试间的普通摄像头面前,我们能够看到大概7-8米之外的人像已经完全模糊。据赵勇介绍,在我国99%的安全监测场景均使用普通高清摄像头,也就意味着在距离相机五米之外,人脸所占像素仅为75*75 pixel以下,无法实现人脸清晰比对和识别。 该类产品的推广意义也在于此,通过计算可以得到,按50米半径范围计算该“人眼相机”可覆盖的监控范围与足球场面积大小相当。“潜在逃犯在如此远的距离之外不会意识到摄像头的存在,疑犯线索也会更加丰富和准确”,赵勇分析。但如果后台数据都按两亿级别像素存储,后台数据的运行压力是否过大?针对此,赵勇进行了解释,图像存储过程中计算机会提取出有意义、有价值的信息,从而避免信息冗余。 (责任编辑:本港台直播) |