第二个层次是智能问诊,我刚才讲到的是的 Watson 的这个例子,百度医生我们最近推出的智能问诊也做了一些测试,比如说,我们在北大国际医院做过一个测试,在 80% 的情况下,百度医生的诊断和北大国际医院的医生诊断是一致的,也就是说它的准确度其实是在迅速地提升。而且它有可能想到一些比较罕见的情况,比如说同样的症状,有 99% 是某个疾病,但是可能有万分之一,甚至十万分之一的概率是另外一个东西,在这种情况下,作为一个电脑,它可以辅助医生做一些相应的判断。这些技术不仅仅需要对大量的医疗知识进行机器学习,也需要对病人表述的理解能力不断地提升,实际上这就是自然语言理解的方向。 第三个层次是基因分析和精准医疗,其实这是这些年做计算机科学最觉得兴奋的方向。因为在 IT 领域我们讲摩尔定律,在 IT 领域以外唯一符合摩尔定律的就是基因测序的成本,所以我们觉得这方面很有可能会不断地出现一些革命性的东西。目前看,用基因来进行治病,最大的一个问题是大多数已知的基因导致的疾病都是单基因导致的,而这些病又大多是罕见病,而大多常见病我们猜测是多基因导致的。多个基因的共同作用再加上有各种各样 pathway 过去导致的,所以怎样能够搞清楚一个病它是由哪些基因共同作用导致的,其实需要大量的计算。詹启敏教授在协和时我们跟他有一个合作的项目,就是对中国的食管癌病人进行基因测序,试图找到是哪些基因的共同作用能够导致癌症的发生,一旦我们搞清楚这些,未来像基因编辑等这些治疗方法就可以用在更多常见病上。目前,基因编辑的应用都是在一些罕见病上,比如美国 Spark Therapeutics 它能对一种导致人视力下降、失明的病毒造成的罕见病进行治疗,但是这些病都太罕见了。大多数的病我们需要搞清楚是哪些基因共同导致的,而这里就需要大量的计算。 当我跟医疗行业的人进行交流的时候,在我们看来很深奥的医学知识,在他们看来其实很简单;反之亦然,在我们看来很简单的计算,在他们看来这就是大数据、人工智能,有点难。所以我们很希望真正把几十万台服务器的计算能力、深度学习的最先进的算法能够应用到医疗和健康领域。 第四个层次是新药研发,今天已知的有可能能够形成药的小分子化合物大概是 10 的 33 次方这么多,这大概就是全宇宙所有的原子加起来都没有这么多。这样的一个量,怎样用它的分子式跟产生疾病的蛋白去合在一起,用来治病?已知的药物是怎么合的?未知的那些分子式怎样进行大量的筛选,找到有限的药的 target?这也需要极其强大的计算能力和最先进的算法,这方面美国的有些创业公司,比如 Atomwise 已经在做这个事情,我们也是觉得计算机科学、人工智能能够在这方面有所帮助。 正如我在开头讲的,很希望两方面的人共同努力,我们用我们大数据的能力、用自己无穷无尽的计算能力,而医疗健康领域希望能够收集越来越多的数据、提出一些至少是计算领域越来越难的问题,我们共同造福数亿患者。 (责任编辑:本港台直播) |