机器学习如何解决看病难？

2024.05.13

    先来看两个场景：
    场景 1：
    一名 49 岁的病人注意到肩膀上起了皮疹，因为不觉得疼痛，所以也没有寻求治疗。几个月之后，他的妻子让他去看医生，医生诊断出他患了脂溢性角化症。后来，当该患者在做肠镜筛查时，护士注意到他的肩膀上有黑色斑点，于是建议他去检查一下。又过了一个月，这位患者去看皮肤科医生，医生从病变的地方取了一些活检样本。结果显示这是一种非癌性色素沉淀病变。医生还是很担心，建议二次检测活检样本，最终诊断出了侵袭性黑色素瘤。之后，肿瘤科医生用全身化疗的方法治疗这位患者。一位医生朋友问病人为什么不接受免疫治疗。
    场景 2：
    一名 49 岁的病人用手机 app 拍了一张肩膀上皮疹的照片，app 建议他立即预约皮肤科医生。他的保险公司自动批准直接转诊，app 帮他在两天内预约了附近一名经验丰富的皮肤科医生，该预约和患者的个人行程自动交叉核对过了。皮肤科医生对病变处进行了活检，病理学家在计算机辅助下诊断出 Ⅰ 期黑色素瘤，然后皮肤科医生进行了摘除手术。
    对比场景 1 和场景 2，我们可以发现，在同样的一个病例中，场景 2 的医疗流程实现了以下优化：1）患者可以直接用手机拍摄病变照片，由 app 进行初级诊断，系统可以根据 app 提供的建议合理分配医疗资源；2）皮肤科医生和病理学家实现了有效的协作，相当于让一位普通病人也得到了专家会诊，提高了诊断和治疗方法的准确性。这就是 Jeff Dean 等人为我们描绘的机器学习在医疗领域的应用蓝图。
    如果重症监护人员或社区医疗人员每做出一个医疗决定，立刻就会有相关领域的专家组成的团队对这条决定进行审查，判断这条决定是否正确并对其进行指导，那会是什么样呢？最新诊断出没有并发症的高血压患者将会接受现有最有效也最对症的治疗，而不是诊断者最熟悉的治疗方法。这样可以很大程度上消除用药过量和处方错误的问题。患有神秘且罕见疾病的患者可以直接由相关领域的知名专家会诊。
    这样的系统似乎离我们很远。因为没有足够的专家可以配合这样的系统。就算有，对专家们来说，不仅要花很长时间了解患者的病史，而且与隐私相关的问题可能也会成为阻碍。但这就是用于医疗领域的机器学习的前景——几乎所有临床医生所做的诊断决定以及数十亿患者的诊断结果组成的智慧结晶应该为每一位患者的医疗护理提供指导。也就是说，应该根据患者所有已知的实时信息和集体经验得出个性化的诊断、管理决策以及治疗方案。
    这种框架强调机器学习不仅是像新药或者新的医疗器械这样全新的工具，而是一种基础技术，这种技术可以高效处理超出人类大脑负荷的数据。这种巨大的信息存储涉及到庞大的临床数据库，甚至单个患者的数据。
    50 年前的一篇专题文章指出，计算将「强化，在有些情况下可以很大程度上取代医生的智慧」。但到 2019 年初，由机器学习驱动的医疗保健几乎还没有取得什么进展。我们在此不再赘述之前报道过的无数通过测试的概念验证模型（回顾性数据），而是要说一些医疗健康领域的核心结构变化及范式转变，这对于实现机器学习在医疗领域的前景来说是必需的。
    机器学习解释
    传统上讲，软件工程师通过清晰的计算机代码形式提取知识，从而指导计算机如何处理数据并做出正确的决策。例如，如果病人血压升高，而且没有接受抗高血压药物的治疗，那正确编程的计算机可以提出治疗建议。这类基于规则的系统具有逻辑性和可解释性，但正如 1987 年的一篇文章中所说，医疗领域「太过广泛也太过复杂，因此难以（如果可能的话）在规则中捕获相关信息」。
    传统方法和机器学习之间的关键区别在于，在机器学习中，模型是从样本中学习而不是按规则编程的。对于给定任务，样本给定输入（特征）和输出（标签）。例如，将病理学家读取的数字化切片转换为特征（切片像素）和标签（上面的信息表明切片是否包含指示癌变的证据）。用算法从观测值中学习，然后计算机决定如何从特征映射到标签，从而创建泛化模型，这样就可以在未曾见过的输入上正确执行新任务（例如，从未被人读取过的病理学切片）。图 1 总结了这一过程，这就是所谓的有监督的机器学习。还有其他形式的机器学习。表 1 列出了用于临床的案例，这些模型的输入输出映射基本上都是基于同行评审研究或现有机器学习的扩展。
    图 1：有监督机器学习的概念性概述
    表 1：推动机器学习应用的输入数据和输出数据类型示例
    在实际应用中，预测准确性至关重要，模型在数百万特征和样例中找出统计模式的能力绝对可以超过人类的表现。但这些模式不一定适应基本的生物学鉴定方式，也不一定能识别支持新疗法的开发过程中可修改的危险因素。
    机器学习模型和传统的统计模型之间并非泾渭分明，最近有一篇文章总结了这两者之间的关系。但复杂的新型机器学习模型（比如「深度学习」（一种利用人工神经网络的机器学习算法，它可以学习到特征和标签之间极其复杂的关系，在诸如图像分类等任务上的表现已经超越了人类））很适合学习现代临床病例中产生的复杂、异构数据（比如医生写的医疗记录、医学图像、来自传感器的连续监控数据以及基因组数据），从而做出医学相关的预测。表 2 提供了简单和复杂的机器学习模型分别适用于什么样的情况。
    表 2：决定要用哪种模型时要问的关键问题
    人类学习和机器学习之间的关键区别在于人类可以从少量数据中得到普适且复杂的关系。例如，小孩不用看太多样本就能区分猎豹和猫。在学习相同任务的情况下，和人相比机器需要更多的样本，而且机器不具备常识。但从另一个角度上讲，机器可以从大量数据中学习。用数千万患者存储在 EHR（Electronic Health Records，电子健康记录）中的数据来训练机器学习模型是完全可行的，这些数千亿的数据点完全没有任何重点，而人类医生在整个职业生涯中都很难接诊数万名患者。


    1  2  下一页>