AI 预测病人去世时间,准确率达 90%

计算机科学家开发了一种算法,可以预测重症患者的生存时间。

2007 年,著名医学期刊《新英格兰医学杂志》(The New England Journal of Medicine)刊登了这样一件怪事,一只名叫 Oscar 的 2 岁小猫要比大多数医生更善于预测病人的死亡。Oscar 是罗得岛 Steere House 养老院医务人员收养的一只黑白相间的猫,在养老院的某一层长期占据着一席之地。当它嗅嗅空气,伸出脖子并蜷缩在某个人旁边时,就意味着那个人的生命即将消亡,医生会打电话通知家属做临终告别。在几年的时间里,这只猫已经蜷缩在 50 名患者身边,每个人都在不久之后逝世了。

没有人知道这只猫究竟有没有强大的死亡嗅觉;如果有,它又是通过什么方式预知死亡的。也许 Oscar 的鼻子学会了发现垂死的细胞释放出的一些独特的死亡味道,也许它捕捉到了其他被我们忽视的迹象。

难以预测的死亡黑箱

当年,这个故事引起了我的强烈好奇,因为我一直在治疗一名食道癌患者:S 先生,他是一名 32 岁的水管工。他对化疗和放疗反应良好,我们通过手术切除了他的食道,在他的体内也没有发现任何恶性肿瘤。一天下午,在他完成治疗几周后,我谨慎地提出了临终关怀的话题。虽然当时他情况良好,但还是存在很小的复发的可能性。他有一个年轻的妻子和两个孩子,还有一个每周带他去化疗室的母亲。我建议,也许他可以和家人开诚布公地谈一谈这个问题。

但 S 先生拒绝了。他的身体状况越来越好,精神状态十分振作,癌症也已经离他而去了,为什么偏要说这些扫兴的话呢?尽管有所顾虑,我还是同意了他的观点,癌症看样子是不会回来了。

但是复发真的出现的时候,像洪水一样吞噬了他的生命。在离开医院两个月后,S 先生又回到我这里,这一次,癌细胞转移到了他的肝脏、肺部甚至他的骨头里。疾病造成的疼痛非常可怕,只有最高剂量的止痛药物才能镇痛,而 S 先生在他的生命最后几周始终处于昏迷状态,无法回应在他的床边的家人。他的母亲起初恳求我对他进行化疗,然后指责我没有及时预知 S 先生的状况。我惭愧地说:我知道,医生对病人的死亡很难预测,死亡是我们的终极黑箱。

一项由伦敦大学学院的研究人员开展的研究,调查了医生对临终病患的寿命预测情况。在超过 12,000 个病例中,医生整体的判断准确度并不高。有些医生可以准确地预测死亡,其他人则将患者寿命低估或高估了近三个月。总之,医生是很难判断临终病人还剩下多少时日的。

AI 打造“死亡算法”?

但是如果算法能预测死亡呢? 2016 年年底,斯坦福大学计算机科学系的一名研究生 Anand Avati 和医学院的一个小团队试图开发一种算法,以确定时日无多的病患的寿命。Avati 告诉我:“医院的临终关怀小组面临严峻的挑战。我们怎么能找到那些会在三到十二个月内死亡的病人?”这个时间间隔是临终关怀的最佳的区间。超过 12 个月的临终关怀服务可能会造成不必要的资源浪费,也会造成供应紧张;相反,如果死亡在三个月内就会发生,可能并没有足够的准备时间。Avati 知道,识别出那些处于“死亡时间段”的患者,可以帮助医生对他们采用更合适、更人道的医疗干预措施。如果算法有效,临终关怀团队将更快地搜寻到那些最需要帮助的人。

Avati 和他的团队确定了约 20 万名患者作为学习样本。该团队的主要参数是医院的医疗记录,数据涵盖多种疾病,包括癌症、神经系统疾病、心脏病和肾脏衰竭等。假设一名男子在 2017 年 1 月死亡,如果你将时间回溯到“临终关怀的最佳时间”,就来到了 2016 年 1 月至 10 月间。Avati 知道,为了在这个时间段锁定病人,你需要在此之前就收集和分析他的医疗信息。那么该怎样通过这个人的信息,就能使医生准确预知病人会在三到十二个月的时间内死亡呢?又需要什么样的数据才能教会算法来进行这样的预测呢?

Avati 利用了医院医生已经编码的医学信息:病人的诊断说明,预定的扫描次数,在医院里度过的天数,所做的各种手续,医疗处方等等。这些信息当然是有限的,没有问卷调查,没有对话,也不需要用鼻子嗅探化学物质,但它们是一些客观的标准化参数。

这些信息被输入到深度神经网络(一种软件架构,因为它模仿大脑神经元的组织方式)中。算法的任务是调整每条信息的权重和强度,以便生成一个给定患者在 3 到 12 个月内死亡的概率分数。

这套“死亡算法”从近 16 万名患者身上采集信息进行自我训练。当它学习了所有数据之后,Avati 的团队对剩下的 4 万名患者进行了测试。这一过程算法的表现很出色,错误率很低,算法认为会在 3 到 12 个月内死亡的患者中,90% 都得到了应验。算法认为存活期超过一年的患者,95% 存活超过 12 个月。(这个算法使用的数据可以在将来得到很大的改进,扫描结果,医生的笔记或者病人的自我评估都可以加入到这个系统中,从而提高预测的精度。)在 2017 年 11 月的 IEEE 国际生物信息学与生物医学大会上,Avati 对此项研究进行了报告。

那么算法究竟是怎么“学习”死亡的过程?反过来,它对肿瘤学家会有什么帮助吗?深度学习一个令人迷惑的地方就是,它无法告诉我们它是如何学到的这些,它推算出概率,但它不能轻易地表达背后的逻辑。就像一个磕磕绊绊学会了骑车的孩子,他并不清楚自行车骑行的力学规则一样。当我们问“为什么”时,算法看上去如此茫然。于我们而言,它就像死亡一样是另一个黑箱。

但是,当你撬开这个箱子看个别案例时,你会看到一些出乎意料的事情。正如预测的那样,一个分数为 0.946 的男子在几个月内死亡。他曾经患过膀胱癌和前列腺癌,经历了 21 次扫描,已经住院了 60 天 ,所有这些都被算法确定为即将死亡的迹象。但令人惊讶的事实是,他的脊椎也接受了扫描,这是我和我的同事可能会忽视的迹象,我后来意识到,核磁共振成像技术用于脊髓很可能意味着癌细胞已经转移至神经系统,而这无疑是致命的。

看到“死亡算法”,我就会想起我曾经的患者 S 先生。如果有一个更完善的算法可供使用,我会用在他身上吗?一定会的。如果那样做的话,S 先生就可以跟家人好好地度过最后的时光。但是算法可能比大多数人更好地理解死亡模式,这个想法还是让我觉得不安。也许如果它改变一下形式,不再输出概率,而是包裹在一个黑白相间的毛绒绒的盒子里,偶尔蜷缩在人们身边,这样就更容易被人们接受了吧。

作者简介:

Siddhartha Mukherjee 是一名印度裔美国医生,他先后从牛津大学和哈佛大学获得 PhD 及医学博士,现任哥伦比亚大学助理教授。Mukherjee 著有畅销书《万病之王:癌症传记》,并凭借此书获得普利策奖。