一种用于治疗癌症的新型人工智能工具
哈佛医学院的科学家设计了一种多功能的、类似 ChatGPT 的 AI 模型,能够针对多种癌症执行一系列诊断任务。AI模型可以诊断癌症、指导治疗选择、预测多种癌症类型的生存率 。
研究人员表示, 9 月 4 日发表在《自然》上的这种新型人工智能系统 比目前许多癌症诊断人工智能方法更进了一步。(DOI 10.1038/s41586-024-07894-z)
目前的人工智能系统通常被训练来执行特定任务——例如检测癌症存在或预测肿瘤的基因图谱——而且它们往往只对少数几种癌症类型有效。相比之下,新模型可以执行广泛的任务,并在 19 种癌症类型上进行了测试,使其具有与 ChatGPT 等大型语言模型一样的灵活性。
虽然 最近已经出现了其他基于病理图像的医学诊断基础 AI 模型 ,但据信这是第一个能够预测患者结果并在多个国际患者群体中验证该结果的模型。
事实证明,该模型在与多种癌症的癌症检测、预后和治疗反应相关的多项任务中非常有用。
该人工智能模型通过读取肿瘤组织的数字幻灯片来工作,它可以根据图像上看到的细胞特征检测癌细胞并预测肿瘤的分子特征,其准确度高于大多数当前人工智能系统。它可以预测多种癌症类型的患者生存率,并准确定位肿瘤周围组织的特征(也称为肿瘤微环境),这些特征与患者对手术、化疗、放疗和免疫疗法等标准治疗的反应有关。最后,该团队表示,该工具似乎能够产生新的见解——它确定了以前未知的与患者生存相关的特定肿瘤特征。
研究小组表示,这些发现进一步证明了人工智能方法可以提高临床医生有效、准确地评估癌症的能力,包括识别可能对标准癌症疗法反应不佳的患者。
如果得到进一步验证和广泛应用,该方法可以早期识别可能从针对某些分子变异的实验性治疗中受益的癌症患者,这种能力在世界各地并不统一。
培训与绩效
该团队的最新成果建立在之前关于结肠癌 和脑肿瘤评估 AI 系统的研究基础之上 。这些早期研究证明了该方法在特定癌症类型和特定任务中的可行性。
新模型名为 CHIEF(临床组织病理学成像评估基础),它基于 1500 万张未标记图像进行训练,这些图像被分成感兴趣的部分。然后,该工具基于 60,000 张全切片图像进行进一步训练,这些图像包括肺、乳腺、前列腺、结直肠、胃、食道、肾、脑、肝、甲状腺、胰腺、宫颈、子宫、卵巢、睾丸、皮肤、软组织、肾上腺和膀胱等组织。通过训练模型查看图像的特定部分和整个图像,它能够将一个区域的特定变化与整体背景联系起来。研究人员表示,这种方法使 CHIEF 能够通过考虑更广泛的背景而不是仅仅关注某个特定区域来更全面地解读图像。
经过训练后,该团队对来自全球 24 家医院和患者群体的 32 个独立数据集中的 19,400 多张全幻灯片图像测试了 CHIEF 的性能。
总体而言,CHIEF 在以下任务上的表现比其他最先进的 AI 方法高出 36%:癌细胞检测、肿瘤来源识别、预测患者结果以及识别与治疗反应相关的基因和 DNA 模式的存在。由于其多功能训练,无论肿瘤细胞是通过活检还是手术切除获得,CHIEF 的表现都同样出色。而且,无论使用何种技术将癌细胞样本数字化,它的准确性都一样高。研究人员表示,这种适应性使 CHIEF 可用于不同的临床环境,并且代表着超越当前模型的重要一步,这些模型往往仅在读取通过特定技术获得的组织时表现良好。
癌症检测
CHIEF 在癌症检测方面实现了近 94% 的准确率,在包含 11 种癌症类型的 15 个数据集中,其表现明显优于当前的 AI 方法。在从独立队列收集的五个活检数据集中,CHIEF 在食道、胃、结肠和前列腺等多种癌症类型中的准确率达到 96%。当研究人员在手术切除的结肠、肺癌、乳腺癌、子宫内膜和宫颈肿瘤的未见过的载玻片上测试 CHIEF 时,该模型的准确率超过 90%。
预测肿瘤的分子特征
肿瘤的基因组成是决定其未来行为和最佳治疗方法的关键线索。为了获得这些信息,肿瘤学家需要对肿瘤样本进行 DNA 测序,但由于将样本送到专门的 DNA 测序实验室需要花费大量成本和时间,因此这种详细的癌症组织基因组分析在世界各地并统一进行。即使在资源丰富的地区,这个过程也可能需要数周时间。这是人工智能可以填补的空白。
研究人员表示,快速识别图像上提示特定基因组畸变的细胞模式可以提供一种快速且经济高效的基因组测序替代方法。
通过观察显微镜载玻片,CHIEF 的表现优于目前用于预测肿瘤基因组变异的 AI 方法。这种新的 AI 方法成功地识别了与癌症生长和抑制有关的几个重要基因的特征,并预测了与肿瘤对各种标准疗法的反应程度有关的关键基因突变。CHIEF 还检测到了与结肠肿瘤对一种称为免疫检查点阻断的免疫疗法的反应程度相关的特定 DNA 模式。在查看全组织图像时,CHIEF 以超过 70% 的总体准确率识别了 54 种常见突变癌症基因中的突变,优于目前最先进的基因组癌症预测 AI 方法。对于特定癌症类型的特定基因,它的准确率更高。
研究团队还测试了 CHIEF 预测与 FDA 批准的靶向疗法反应相关的突变的能力,这些突变涉及 18 个基因,横跨 15 个解剖部位。CHIEF 在多种癌症类型中都取得了很高的准确率,包括在检测一种名为弥漫性大 B 细胞淋巴瘤的血癌中常见的 EZH2 基因突变时准确率达到 96%。它在甲状腺癌中对 BRAF 基因突变的检测准确率达到 89%,在头颈癌中对 NTRK1 基因突变的检测准确率达到 91%。
预测患者生存率
CHIEF 成功地根据初次诊断时获得的肿瘤组织病理学图像预测了患者的生存率。在所有癌症类型和研究的所有患者群体中,CHIEF 都能区分长期生存患者和短期生存患者。CHIEF 的表现比其他模型高出 8%。在癌症晚期患者中,CHIEF 的表现比其他 AI 模型高出 10%。总之,CHIEF 预测高死亡风险和低死亡风险的能力在来自 17 个不同机构的患者样本中得到了测试和确认。
提取有关肿瘤行为的新见解
该模型在图像上识别出与肿瘤侵袭性和患者生存相关的明显模式。为了可视化这些感兴趣的区域,CHIEF 在图像上生成了热图。当人类病理学家分析这些 AI 得出的热点时,他们看到了有趣的信号,反映了癌细胞与周围组织之间的相互作用。其中一个特征是,与短期幸存者相比,长期幸存者的肿瘤区域存在更多的免疫细胞。这一发现是有道理的,因为更多的免疫细胞存在可能表明免疫系统已被激活来攻击肿瘤。
在观察短期幸存者的肿瘤时,CHIEF 确定了感兴趣的区域,这些区域的特点是各种细胞成分之间的异常尺寸比率、细胞核上的非典型特征、细胞之间的连接较弱以及肿瘤周围区域结缔组织较少。这些肿瘤周围也有更多死亡细胞。例如,在乳腺肿瘤中,CHIEF 将组织内坏死(或细胞死亡)的存在确定为感兴趣的区域。另一方面,存活率较高的乳腺癌更有可能保留类似于健康组织的细胞结构。研究小组指出,与生存相关的视觉特征和感兴趣区域因癌症类型而异。
下一步
研究人员表示,他们计划通过以下方式改进 CHIEF 的性能并增强其功能:
- 对罕见疾病和非癌症组织图像进行额外训练
- 包括细胞完全癌变之前的癌前组织样本
- 向模型提供更多分子数据,以增强其识别不同侵袭程度癌症的能力
- 训练模型,除了标准治疗外,还能预测新型癌症治疗的益处和副作用