未来医生的终极形式可能是:左手数据,右手温情。用情感去安慰支持,用数据来指导治疗。”做一个有温度的数据化医生”,这是我未来希望发展的方向。
序言:量化自己
量化生活(quantified self)”这个词最早由美国的 Gary Wolf 和 Kevin Kelly 在 2007 年提出,核心是“通过自我追踪进行自我认知”,他们描述的这部分人热衷于用科技方式记录自己日常生活中的各种数据,作为优化生活的依据。量化生活也称作“自我跟踪”(self-tracking)、“生理信息”(body data)或者“生活数据化骇客”(life hacking)(引用自维基百科)。
用数据记录自己工作和生活的方式久已有之。在苏联作家格拉宁所著的传记类著作《奇特的一生》里,就记述了原苏联科学家柳比歇夫坚持56年用精确到分钟的“时间统计法”来管理时间并安排自己的工作,最终完成了传奇而高产的一生,柳比歇夫也被捧上了时间管理大师的神坛。
但在早期,由于缺乏各种传感设备,因此能够获取到的数据量很少。随着科技不断进步和发展,类似 Watch等佩戴设备不断进入市场,社交网络数字化程度不断加深,个人数据量正在不断增加,因此,量化自我的概念也得到了深入发展。
一位名叫Nicolas Feltron的设计师是这一想法的忠实实践者,他利用各种方式记录自己的生活数据,然后在每年都写出一个年度报告, 视觉化呈现这一年中他的生活,将“量化自我”这件事情做到了极致。他的官方网址是:Feltron。
在医疗领域,这样的“量化医生”也很多,他们热衷于记录个人手术的数量,用于技术分析、演讲授课和学术出版。如美国著名的神经外科Robert Spetzler教授在职业生涯内夹闭了超过6000例颅内动脉瘤,成为了世界上夹闭动脉瘤最多的医生之一,并再次基础上发表了很多“个人经验”性质的文章。另一位日裔著名的神经外科医生──被誉为“上帝之手”的福岛孝德(Fukushima),也十分热衷于记录个人数据并刊登在自己的官方网站上,并宣布自己的手术成功率高达99%,颇有些“个人英雄主义”的色彩。
我周围的朋友圈中也不乏大量的“量化青年”,热衷于用数据来记录自己的生活与工作曲线,如“每天走了多少步”,“一年读了几本书”,“衣橱里有几件衣服”等等。事实上,每个人都能够切实感受到:在最近几年,个人相关的数据正在以指数级的速度进行增长。与之对应的,致力于数据整合与分析的“大数据”相关产业的不断崛起。从2013年Viktor Mayer-Schonberger和 Kenneth Cukier发表了大数据领域的著名著作《Big Data: A Revolution That Will Transform How We Live, Work and Think》以来,大数据第一次真正的开始进入大众级别的生活与工作领域。数据主义(Dataism)也随之兴起。
数据主义者的兴起
数据主义者(Dataism),是最近发明的一种数据哲学或意识形态的术语。目前多认为这个术语源自著名的政治评论员和《纽约时报》的作家大卫·布鲁克斯(David Brooks)。布鲁克斯提到:“数据主义是一种对数据的痴迷,它假定对任何场景都能够用数据进行度量,并根据数据产生有价值的结果。”
数据主义者的一个主要特征是希望通过将一切都联系在一起(物联网概念),来最大化信息流,用以构建一个智能终端。这一意识形态的支持者相信,这个智能终端体系本身比你更了解你自己,会作出符合你心意的推荐与设定。最终,我们将越来越依赖它来做出每一个决定,因为它会做得更好。
数据主义者认为:人类的内心喜好其实是一系列“化学反应”的综合,其本质仍然是“数据流”,在一定前提下,是可以预测的,给它作为参考的数据越多,智能终端预测的准确性就越高。这一概念在商业世界中的应用已经日趋广泛。这也就是为什么像淘宝、亚马逊等网站都开始尝试根据既往购买记录进行“个性化推荐”;智能家居知道你最喜欢的空调温度和电视节目。苹果手机的Siri助手知道你最喜欢的菜肴口味和娱乐方式。这些在未来的几年中会愈加迅速的发展,方便人类的生活。
在我看来,数据主义者是一个系统论者。它既承认单个个体的局限性,但是又充分强调单个个体的自发运转,为整个系统贡献数据、添砖加瓦,最终以“我为人人,人人为我”的状态,积“小数据”为“大数据”,共同使系统不断优化,以达到远超过单个个体能力的状态,并以这样的数据,来作为任何决策的依据。
在《未来简史》这本书中,有一个很形象的描述:当询问人类一个问题时,宗教主义者会说:“要听从神(圣经)的旨意“;人文主义者会说:”要听从内心的召唤“;数据主义者会说:”要听从Google的建议,因为它最懂你“。
医疗领域中的数据主义者
我曾经在《永不放弃希望的救治,是对是错?》一文中提到了我对于治疗决策的困惑。困惑的本质在于:医生要在复杂危急情况下给出最终诊疗建议,宣判一个病人是“没有希望”或是“还有希望”,虽然有很多的客观数据来辅助医生进行判断,但是更重要的决策因素却是医生的知识面和临床经验。因此这样的决策模式是难言客观的。
当然,医学决策本身就没有“终极最优解”的存在,只有“当时当刻最合适的处置”。这是医学知识与人类本身的客观限制所决定的。
现代医学教育制度,包括住院医师规范化培训制度,都希望利用长时间标准化的训练使医生获得同样的资质能力,在同样的场景中作出同样的判断,但要达到这个理想化的“均质状态”同样十分困难。
而这些困境在数据主义者面前,都可以迎刃而解。利用大量的数据,有望突破医生个人认知的限制,获得“目前认知领域下的最优解”。这对全世界发展严重不均衡的医疗卫生事业来说,无疑是一件天大的好事。
事实上,在数据主义者这个概念被提出之前,医疗行业中就有很多先驱已经尝试用大量阅读,手工搜集整理数据的方式来践行这个理念了。我在美国纽约学习时,跟随我的导师Philip Stieg教授看门诊,他在与病人沟通的时候,对于常见疾病的各种数据如数家珍,我将其详细的记录在了我的学习笔记《从美国门诊看医患沟通》中。他的这种方式给了我很大的启发,也对我后来与患者的沟通模式打下了伏笔。然而这样的模式,仍然类似于小型手工作坊,依赖于数据收集者“博览群书”和“博闻强记”,不同的人使用的效果可能不尽相同。
我的导师把它们统统归结为4个问题:“得了什么病?”“得了这个病意味着什么?”“有那些治疗方案?”“有哪些风险?”按照这个顺序,可以用最简单的话,把病情解释清楚。对于具体手术过程也会有简单描述,有时候还会画图。在这其中让我最受到震撼的,是他在讲述过程中引用了大量的研究数据。比如,肿瘤复发的可能性有多大,小型动脉瘤保守治疗期间破裂的可能性有多少,两种治疗方法的疗效对比怎样,都有非常具体的数据支持。用客观的数据来向患者及家属说明病情,虽然数字会有些冰冷,但我认为这是最直接有效,并能够有巨大说服力的的办法。
回想起我以前和病人术前谈话的时候,说到围手术期的并发症发生率,家属总是问我“概率有多大”,我当时总是推说“对单个病人来说概率没有意义,发生就是1,不发生就是0”,但实际上是因为我并不知道具体的数字,如果我告诉他,术后感染的发生率一般小于3%,术后出血的概率一般在1%以下,或许家属会有更加直观和感性的认识。
随着医疗行业对于文献数据重要性的不断认识,整体医疗模式从几十年前的“经验医学”向十多年前开始提出的“循证医学”进行革新。而随着技术的发展,从“单人手工作业”到“群体共享数据”的转变,医疗模式将再次发生革新,有望从“循证医学”进化到“智能医学”(详见《未来已来 | 人工智能时代,医疗将走向何方?》)。医疗领域中的数据主义者,就是以此作为实践方向,努力实现这一目标的一群人。在这其中,一小部分人会成为“Innovator and Early Adopoters“,创造并调试初级系统。更大数量的人会成为”Fast follower”,应用并优化系统。由于这个系统毫无疑问的将超越单个医生的认知限制,医生最终成为数据主义者,几乎是大势所趋,无可避免将要发生的现实。
医疗领域推行数据主义的限制
与普通商业行业不同,医疗行业存在着先天的壁垒与限制。因此在商业大数据已经发展的如火如荼的今日,医疗大数据仍还处在蓄势待发的阶段。我认为医疗领域对数据主义的限制主要体现在以下方面:
隐私保护
保护患者隐私,是东西方医疗体制都极为重视的基本原则。因此,医院里绝大多数的电子医疗系统都是在内部网络运行,并不与外界联通,对于登录查看的权限设置也十分严苛,以防患者权益受到侵害。事实上,公众目前存在的担忧也集中在这些方面。他们认为,数据是一把双刃剑,数据挖掘系统的能力越强,掌握数据的人就能以多种不同的方式对患者进行其他危害性干预(如进行有针对性的推销等等)。
正因为此,高质量医疗数据的获取来源一直是亟待解决的难题。目前较容易获得是医学书籍和文献报道中的数据,这也是IBM 沃森机器人医生用于给出诊疗建议的基础。而患者诊疗过程中产生的数据:包括实验室化验指标、影像学检查资料、病理切片资料等,仍然很难获得。
混杂因素
“当你面前只有一个钟时,你知道现在是几点;当你面前有两个钟且走的不一样时,你反而失去了对时间的准确概念。”
对于同一个问题展开的不同研究,得到不同、甚至相反的结果都很常见。当遇到这样的情况时,仅看其结论是不够的,而应当进一步的深挖其原始数据,找到造成结论差异的真正原因(混杂因素)并将其剔除,最终得到真正的结果。“千淘万漉虽辛苦,吹尽黄沙始得金。”然而,由于种种局限,也处于对于参与临床试验的研究者隐私的考虑,大量的数据都处于沉淀状态,无法得到深度的挖据。
破冰之行──数据开源
密闭式封装的软件,在保护了软件创作者知识产权的同时,也给“病毒、木马”盖上了伪装的幕布,让一般使用者很难识别,从而中招。近年来频频报道一些公司开发的软件,被悄悄安装了后门,用于窃取用户的隐私。因此,近年来,在软件领域,开源软件(开放所有源代码供软件开发同行及用户监督)如雨后春笋般的发展起来,以Github为代表的开源社区,赢得了越来越多用户的信任。
在医疗领域,这一“数据开源”行动在2017年也正式拉开帷幕。2017年6月,在《新英格兰医学杂志》、《柳叶刀》、《JAMA》等杂志上,同步刊登了“Data Sharing Statements for Clinical Trials — A Requirement of the International Committee of Medical Journal Editors”这一篇文章,要求从2018年7月以后提交的所有临床研究报告,都把去身份化(即隐藏受试者身份识别信息)的临床研究数据公开共享。通过将原始研究信息公开,第三方研究机构可以检查其中的数据,也可以有机会进一步挖掘数据,进行亚组分析,以提高数据利用率,也有利于获得更精确的决策信息。
这一“开源”行动,在有效的保护患者隐私的前提下,最大程度的给全世界的研究者提供了去除混杂因素,探寻数据背后隐藏真理的可能性。
数据开源的呼吁最早始于一些Open Access杂志,此后得到了老牌杂志的积极响应和支持,新英格兰医学杂志更是在2016年开展了一项比赛,采用发表在NEJM上面的一项重要研究叫SPRINT作为数据来源,邀请全世界的研究者对其进行数据分析。该项挑战赛获得了全球近200支队伍参加,发现了143项新的数据分析结果。经过专家评审团的评比,最终来自以色列特拉维夫的Noa Dagan, M.D., MPH拔得头筹。大赛的组织者,新英格兰医学杂志主编Dr. Jeffrey Drazen这样评价:“临床试验提供了丰富的医学数据来源,随着计算机能力的提高,更多的人接受了数据分析培训,使得这些数据的应用更具创造性。可以肯定的是,独立分析师会在这些数据中找到更令人信服、更令人意外的结果。”
可预测的一个未来场景是:未来任何一个研究的原始数据公开之后,都可以利用一个标准化的统计学处理器,用现有的各种统计学方法进行分析,同时将数据进一步分解,与其他研究进行组合,再进行二次分析,从而得出尽可能丰富的结论数据,用于指导临床实践。
当然,这只是针对临床研究的数据。对于真实医疗过程中产生的数据,收集整理仍处在一个相对初始阶段,要在短时间内获得大的突破仍有难度。
左手数据,右手温情
医疗数据化的趋势已经不可避免,它就像列车,虽然还距离很远,但是隆隆的声音已经清晰可闻。对医生而言,最重要的当然就是尽可能的让自己成为“Early Adpotor”或是“Fast Follower”,学习和掌握使用最新工具,才能在知识日新月异的医学世界里随时保持作出“最佳医疗决策”的能力。
但医学从来都不是一个冷冰冰的科学,医生治疗的是病人,而非单纯的疾病。病患有情感的需求,需要被倾听、理解、支持,而非只是需要一个“理论上最佳的治疗方案”。“有时去治愈,常常去帮助,总是去安慰”,特鲁多医生的这句话,无论技术发展到何种程度,都不会过时,这一点,是任何数据都无法替代的。
用情感去安慰支持,用数据来指导治疗。”做一个有温度的数据化医生”,这是我未来去希望发展的方向。
2017年12月31日 at 下午8:27
涛哥很赞的文笔和内容,17年的最后一天在列车上细读之后感受颇深,随着技术革命和信息发展的加速度,我们终究要走向何方?医者又要走向何方?无疑我们是幸福时代,有着随手可得的各种各样的资料和知识,然而在这爆发的信息里如何取舍反而让很多人迷茫。
数据时代和基于数据的人工智能时代正在飞速走来,2017被称为AI元年,但其成长的速度却是惊人,数据是没有价值的,有价值的是清洗过后的数据,左手数据,涛哥说的很明确,要明确他人的也要明确自己的,只是,工作中,我既会告诉患者发生的概率,也会告诉他们对于个体统计学的无意义性,0或1,同事右手温情也会竭尽所能来避免意外的发生。
最近也一直在思考这些问题,尤其是个体化的成功,记得去年萨米爷爷来京时说,我们神外医生已经不能再用概率去做手术,而是要追求每一个病人的百分百分,当时被深深触动,而与涛哥.达达一起的文章也恰恰践行了这种理念,我想我们已经在路上……
最后说说特鲁多的话,对于医患的情感,人文,温情,我是十分赞同的,然而有时又会矛盾,例如我们去银行,是愿意用便捷的ATM呢还是会选择大堂经理,我想温情永远不会成为医者的最后一块阵地。
左手数据,右手温情,涛哥糅合成太极,必成一代名医。
岁末,遥祝,安好
ZC