医疗数据分析就是要从海量的医疗数据中,寻找医学证据,然后利用这些证据提供更加个性化的基于证据的临床治疗。我们来看一看,从IBM的视角来看,有了计算能力和数据,能做些什么。
那从IBM角度来看,目前做三件事情:1)做一个医疗数据云,把医疗数据先存起来;2)做analytics,怎么对医疗数据进行深度的计算和分析,把它变成模型,一些API;3)做解决方案,怎么针对不同类型的医疗领域客户,打造客户能够使用的具体软件和解决方案。 在医疗领域,我们解决两个问题:一是解决多模态医疗数据的存储问题。医疗数据是多模态数据,有结构化很好的数据,比如化验单、处方;还有一些半结构化的数据,比如住院小结、出院小结、入院首页,病例里面有大段的文本;还有完全无结构化的数据,比如医疗影像;还包括像基因测序这样的组学数据;还包括时间序列数据,比如ICU里会看到一个人插着各种各样的仪器去测量它的血压心率脉搏等各种流数据。这些数据是不同模态的,有些数据适合用关系型的数据存储,有些数据适用时间序列数据存储。目前,没有一种单一数据模型能够覆盖这种多模态的医疗数据,如何有好的云平台去处理多模态医疗数据,这是需要解决的第一个问题。 第二个问题就是安全和隐私问题,因为医疗数据的话我们有很多知道很多这种关键信息泄露信用卡信息泄露,医疗数据的话是非常隐私的个人数据,怎么样对这些数据进行保护,这是云平台一定要做好的。欧美一些国家都有针对医疗数据保护的法规。根据这个法规,医疗数据约有二十几项关键的隐私数据,比如姓名、住址、电话、身份证号,进入数据管理的时候必须要打马赛克去隐私,同时对数据进行强加密,数据即使被泄露也是不可解密的;对所有的数据访问(谁什么时间能访问什么)都要有一套严格的访问控制,通过这样的方式来保证数据安全性。
简单而言,分析层也做两件事情。第一是对多模态医疗数据的分析,不管是结构化病历数据、影像数据,还是文本数据、时间序列数据,不同的数据不存在单一的技术能够对所有数据都进行一个很完美的分析,所以目前针对不同类型的数据有不同的分析方法,有些适合用深度学习的方法,有些采用时间序列的方法,有一些适合用回归分析的方法,分类的方法,聚类的方法。 第二,分析是与医疗领域相关的,医学里有一些特定的问题,不是去分析照片是谁或者什么,而是分析数据里疾病风险的因素是什么,怎么样做疾病的预测和预防,怎么样对患者进行精准分群,可以对患者进行个性化治疗或者有不同的治疗方案时哪种方案对患者反应比较好(treatment effectiveness),包括影像识别怎么自动发现影像中间的病灶,都有非常强的医学知识。从解决方案的角度来看,医疗是一个非常复杂的行业,医院、医生、药厂、医疗设备制造商、健康管理机构、医疗保险公司,他们的诉求是不一样的,不必须要针对不同类型的客户做出不同的解决方案,可以利用底层的云平台和分析技术。在解决方案里,我们有针对像医院类型的医疗机构的解决方案,包括肿瘤的个性化治疗,Oncologyand Genomics,医院影像(medical imaging)的分析。还有针对药企做新药发现和上市药物有效性、安全性的分析,还有帮助健康管理机构,对常见的慢性病人群(高血压、糖尿病、慢性肾病)以及多种并发性慢病的患者进行管理解决方案,也有帮助医疗保险机构合理地valuedbased care,按照价值来付费,来进行疾病管理。在目前的平台上,IBM通过过去两年的收购,目前有超过2亿美国人的医疗保险数据,有超过1亿美国人的电子病历数据,有超过10亿张的医学影像片子,有美国几十个州的慢性病管理数据,把这些数据关联起来做分析,就会发现非常有价值的,任何单一数据源都无法发现的一些insight或者evidence,可以支持上面各种各样的应用。 个性化肿瘤治疗助手和肿瘤基因治疗助手 接下来,给大家来介绍一些具体案例。 第一个我想介绍的是沃森个性化肿瘤治疗助手。 (责任编辑:本港台直播) |