本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

wzatv:【j2开奖】纽约客特稿 | 把癌症诊断交给机器,医疗服务会更好吗?(4)

时间:2017-04-01 01:24来源:报码现场 作者:118开奖 点击:
Thrun 仍然是斯坦福大学的兼职教授,找了两名学生 Andre Esteva 和 Brett Kuprel 帮助他进行研究工作。他们的首要任务是创建一个所谓的「教学集(teaching set)

Thrun 仍然是斯坦福大学的兼职教授,找了两名学生 Andre Esteva 和 Brett Kuprel 帮助他进行研究工作。他们的首要任务是创建一个所谓的「教学集(teaching set)」:一个庞大的图像库,用来训练机器识别恶性肿瘤。Esteva 和 Kuprel 通过网络搜索发现了 18 个由皮肤病专家分类好了的皮肤损伤图像库。其中包含了近 13 万张有关痤疮、皮疹、虫咬、过敏反应和皮肤癌等疾病的图片,皮肤病专家将它们分为近 2000 种疾病。值得注意的是,有一个包含 2000 个病变的集合已经由病理学家切片检查过了,因而它们几乎是被确诊的了。

Esteva 和 Kuprel 开始训练他们的系统。他们没有制定规则;没有教它 ABCD 助记符。相反,他们是将图像和其确诊分类输入神经网络。我请 Thrun 描述这个神经网络的工作内容。

「想象用一个老式的程序去识别一只狗,」他说。「软件工程师会写出 1000 行 if-then-else 语句:如果它有耳朵,和一个鼻子,并有头发,且不是一只老鼠等等,这样循环往复完成识别任务。当然,这并不是一个孩子去学习识别狗的方式。起初,孩子会通过观察以及大人的告知来识别狗。她也许会犯错误,但能纠正自己。当她认为狼是狗时,大人们会告诉她狼属于一个完全不同的类别。于是她一点一点地改变了自己的认识:这是『狗』,那是『狼』。机器学习算法就像孩子一样,从一个已分类好的标注训练集抽取信息。如这是一只狗,那不是一只狗。然后,它从一组一组的训练集中提取出特征。接着,通过对成百上千张已分类图像进行自我测试,机器学习系统像孩子一样开始创建属于自己的方式来识别狗。」它就是知道如何去做(know how)。

2015 年 6 月,Thrun 的团队开始测试通过给机器一个「验证集(validation set)」的方式来了解它从图像主集合中学到了什么:一些经皮肤病专家诊断(虽然不一定是通过活检)的 14,000 张图像。该系统是否能够准确地将图像分为 3 个诊断类别——良性病变、恶性病变和非癌生长?这个系统的正确率为 70%。(该算法的实际输出不是「yes」或「no」,而是某个给定病变属于类别的概率。)两位得到委员会认证的皮肤病学家也在一旁做了测试,不过他们做得更糟:其正确率为 66%。

接着,Thrun、Esteva 和 Kuprel 又将研究扩展到了 25 位皮肤病学家,而这一次他们使用了一个黄金标准——约 2000 张经由活组织检测证实的图像「测试集(test set)」。在几乎每一个测试中,该机器都比这些专家更加敏感:它不太可能错过一个(恶性)黑素瘤。它也比专家们更为明确:它不太可能将一个肿瘤错称为(恶性)黑素瘤。「在每一次测试中,该网络都要优于皮肤病学家,」。

「还有一个有关网络的更深刻的东西没有在该论文中得到充分强调,」Thrun 告诉我。在研究的第一版本中,他和团队开始使用的是一个完全的朴素(naïve)神经网络。但是他们发现,如果是从一个已被训练成识别一些不相关特征(比如狗和猫)的神经网络入手,它会学得更快更好。也许我们的大脑功能也是这样。高中课程中那些令人头脑麻木的练习——因式分解、共轭动词、背元素周期表——可能会得到相反的结果:令人头脑敏锐。

在教机器时,他们团队必须得小心地处理这些图像。Thrun 希望人们有一天只需提交其令人担忧的病变手机照片就可以得到诊断,这意味着该系统必须适用于多种角度和照明条件。但是,他回忆道,「在某些图片中,(恶性)黑素瘤已经被黄圆盘标志标记过了。我们必须把它们裁剪出来——否则,我们可能就是在教计算机将黄圆盘标志作为癌症标志给挑选出来。」

这是一个古老的难题:一个世纪前,德国民众被 Clever Hans 迷住了,据说这匹马可以进行加减运算,并能够通过敲击蹄子来将答案传递出来。事实证明,Clever Hans 实际上是在感受驯马者的态度举止。当马蹄敲击数接近正确答案时,驯马者的表情和姿势就会变得放松。动物的神经网络没有学过算术,却学会了检测人类肢体语言的变化。「这就是神经网络离奇的地方,」Thrun 说。「你不知道它们在使用什么信息。它们就像黑箱,其内部运作是神秘的。」

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容