专访宜远智能:高举科研合作大旗,在AI医疗界「画圆」的初生犊 2017-08-19 23:17 来源:AI掘金志 原标题:专访宜远智能:高举科研合作大旗,在AI医疗界「画圆」的初生犊 在阿里天池医疗AI大赛第一赛季的榜单上,宜远智能以0.806的分数排名第二,加州大学成绩0.815占据鳌头,北京大学以0.780的成绩排名老三,清华、复旦、浙大、上交等国内高校以及GE、联影等医疗器械商均参加了这项比赛。 意料之外Number 2的成绩,让CEO吴博信心大增,“我们原来以为肺结节智能筛查领域没机会了,参与进来才知道,我们这些新兵还是有机会的。”对于今年4月份刚刚成立的宜远智能来说,“这算是一次算法上的肯定,最主要的当然是算法实用性的体现”他说道。此外,与榜单上单打独斗的选手不同,宜远智能与香港浸会大学、南方医科大学合作,共同参赛,相关模型在南方医科大附属医院落地测试,“关键在于跨界融合”。 这种联盟的思想不仅体现在比赛上,在公司主营业务方向上,也发挥得淋漓尽致。“本质上,我们就是画一个圆,团结一切可以团结的力量,与不同医院(医生)进行科研合作。” 到目前为止,这家四个月的公司已经先后与香港大学深圳医院、南方医科大附属医院、复旦大学附属中山医院的科研团队展开合作,项目已经涵盖骨科智能诊断、皮肤病智能筛查、肺结节筛查领域,在具体合作细则上,公司负责模型,医院/医生负责临床问题定位、数据标注解读等。 “算法公司比数据公司值钱” 「算法还是数据,这是一个问题?」 关于算法还是数据孰轻孰重的问题,AI界争论不休,在知乎上,署名为“项亮”的知友获得最高赞同票,“我强烈同意数据比算法重要!虽然我们可以打官腔说这两个同样重要,但如果是一个资深的机器学习和数据挖掘研究人员,绝对不会掩饰他们对数据的渴望,当然对他们来说设计好的算法是很容易的,但好的数据却是不容易拿到的。”而具体到AI医疗领域,相比于算法人才,数据也是更加稀缺和抢手的资源。 而从公司利益的角度,吴博给出的答案却与此截然相反:“算法公司比数据公司值钱”。 今年年初的美国人工智能年会(AAAI-2017)上,Quora工程副总裁Xavier Amatriain曾表示,对于小公司而言,本身数据量就少,而获得标记的数据更是需要额外的成本。小公司堆数据肯定是堆不过大公司,所以选择把精力放在优化算法上往往比选择把精力放在获取数据上更高效。当然一方面小公司也需要不断地积累数据。对此,吴博评说“深得我心!” “毕竟医疗数据难以出现互联网数据那样中心化归集的马太效应,而像素级且冗余的医学数据标注又需要极高的专业素养跟成本,算法才是我们最能发挥主观能动性的部分。” 如果了解宜远智能本身特质的话,会对吴博的观点毫不意外。“我们评估后公司的优势在于算法。”吴博称,对于宜远智能在阿里天池医疗大赛中的第二名成绩,他告诉雷锋网,很多队伍的差别是千分位的差别,就算是0.001级别的FROC位置,都意味着至少20个疑似结节位置的判断的正确。所以,你的FROC的指标比别人或者比自己能提升0.01的话,意味着几百个疑似结节位置你做的更准了。这也是很现实的问题。“在我们看来,医疗没有那么互联网基因,互联网企业是创业驱动的,智能医疗更多是研发驱动的,还是要把研发坐实。” 其算法优势自然可以归因到其创业团队的背景上。吴博本科就读于清华大学,曾任爱立信高级研究员、英国利兹大学博士后、香港浸会大学博士,合伙人刘凯是其同门师弟,香港浸会大学博士,曾为腾讯数据平台高级算法工程师;另一个合伙人吴宇曾同为腾讯数据平台AI算法工程师。吴博曾称,“别的公司连一个AI模型人才都难求,我们连实习生都是伯克利、港科大、港大来顶尖深度学习好手,背后还有一大票教授、国家千人计划的合作伙伴作为后盾。” 旗帜鲜明地打出“科研合作”的牌子 相比对算法的看重,在医疗数据的获取上,吴博认为,或许没有想象得那么难。甚至,“获取”这件事本身,他认为或许也不成立,“ ‘占有’让位于‘共享’是不可阻挡的趋势,医疗数据也会如此。但共享的本质不是所有权共享,而是Access(访问权/使用权)共享,我们对医疗数据也是不求所有,但求所用。”况且,他补充道,“数据本质上也是用户或国家的。” (责任编辑:本港台直播) |