2. 100190 北京, 中国科学院自动化研究所 模式识别国家重点实验室;
3. NY10065 纽约, 美国纽约市纪念斯隆-凯特琳癌症中心
2. National Laboratory of Pattern Recognition, Institute of Automation, Chinese Academy of Sciences, Beijing 100190, China;
3. Memorial Sloan-Kettering Cancer Center, New York NY 10065, United States of America
近年来,辅助医生诊断的技术日益增多,在筛查、诊断患者疾病时,会产生大量数据信息[1]。受限于人的认知能力[2],医生难以在短时间内对这些混杂的数据信息进行全面分析。因此,越来越多的机器学习被应用到医疗领域,帮助医生快速诊断疾病,预测疗效及相关并发症。
肿瘤放射治疗是基于患者影像资料,通过将射线精准地输送到需要照射的部位(靶区),实现杀灭肿瘤细胞的目的。为了将射线精准地输送到靶区,需要计算机对射线的产生及传输过程精确计算以及设备的精准运行,这一过程中会产生大量的数据。机器学习本身就是对大数据的高效收集与运算,这使得肿瘤放射治疗与机器学习的结合有了得天独厚的优势[3]。通过分析已有数据,建立相关模型,分析重要指标趋势,可以预测患者放疗后的疗效及并发症,更加准确地评估患者病情[4-13]。本文对机器学习在预测放疗疗效及并发症中的研究进展进行综述。
一、机器学习的基本流程1.数据收集与分类:机器学习需要收集患者的全部信息,对信息进行分类整理,筛选原始数据,并剔除无用信息[3]。Lambin等[2]建立了数据分类整理的方法,将数据分为4类:临床相关数据、治疗相关数据、影像相关数据和分子相关数据。肿瘤放射治疗中除了常见的病情数据(如血常规、肿瘤类型、分期分级等)外,还包括靶区范围、靶区的总剂量及剂量分布、危及器官的范围、危及器官与靶区的相互关系、危及器官剂量限值、放疗分次数、多叶准直器(multi-leaf collimator,MLC)走位、机架角度和床的移动等,这些数据均会对放疗疗效及并发症产生影响。Lambin等[2]在文章中仅以医生的角度考虑了治疗相关的数据,并没有提到放疗设备在治疗过程中产生的巨大数据,所以非常有必要将这些数据分类收集后,作为特征值输入算法中。
2.算法的选择:分类筛选数据后,机器学习还需要利用不同的算法对数据进行学习。常用的算法包括:决策树(decision tree)、随机森林(random forests)、支持向量机(support vector machine,SVM)、人工神经网络(artificial neural network,ANN)和深度学习(deep learning)等。
决策树是一种树状结构的分类模型,代表的是对象属性与对象值之间的一种映射关系,其每个非叶节点表示一个特征属性上的测试,每个分支代表这个特征属性在某个值域上的输出,而每个叶节点存放一个类别。选择属性顺序不同最终构成的决策树也不同。最终的目标是让各个分裂后的子集尽可能地“纯”,就是尽量让各个分裂子集中待分类项属于同一级别。构造决策树的关键步骤是分裂属性。决策树易受到参数选择的影响而产生过拟合的现象,导致训练的模型泛化能力变弱[14]。
随机森林是通过集成学习的思想将多棵决策树进行组合的一种算法,大大提高了决策树的预测结果,并具有较好的泛化性能。但是,当样本量变大、特征维数变高时,随机森林的执行效率变低。
SVM是一种二分类模型,其基本模型定义为特征空间上间隔较大的线性分类器,其学习策略便是间隔较大化。通过找到这个较大的间隔,可对数据进行分类。
ANN由大量的节点(或称神经元)之间相互联接构成,建立了若干层“神经元”。每个“神经元”都有一个决定其重要性的权重。每一层从上一层接收数据,计算得到一个数值并传递给下一层。通过调整“神经元”的权重和连接关系,实现最佳输出结果。
深度学习是ANN的一个变体,包含深度神经网络(deep neural networks,DNN),卷积神经网络(convolutional neural networks,CNN)等。ANN通常具有一个或两个隐藏层,被认为是有监督的机器学习,而深度学习模型有较多的隐藏层,能够执行有监督或无监督的学习[15]。所谓有监督学习是对具有标记(分类)的训练样本进行学习,以尽可能对训练样本外的数据进行标记预测。而无监督学习是对没有概念标记的训练样本进行学习,以发现训练样本中的结构性知识。
3.建模原则:确定算法后,需要利用数据训练模型,求得模型相关参数。Kang等[16]提出建模的7大原则:①同时考虑剂量相关和非剂量相关特征值。②自动分析前进行人工修正特征值。③选择一个自动筛选特征值的方法。④考虑特征值的多重共线性对模型的影响。⑤正确使用交叉验证来改进和验证对外部数据的普适性。⑥尽可能使模型对外部数据具有普适性。⑦评估多个模型并与已建立的模型进行比较。
二、机器学习在预测放疗疗效中的应用机器学习预测放疗疗效时,通常是基于假设“所有的特征值都是独立的”。实际上,这些特征值是相互依存的关系,找到它们之间的依存关系并评估其对预测结果的影响是比较困难的。Ochi等[4]利用ANN建立宫颈癌放疗后生存率的预测模型,选取了134例接受了外照射和后装放疗的患者,用67例患者作为训练集建立模型预测剩下67例患者的5年生存率,然后与真实的生存率进行比较。他们筛选了与生存率相关的12个特征值,将这12个特征值进行组合,分为6组,利用ANN对这6组进行分析。结果发现,同时包含最大相关性特征值和基本特征值(如年龄、机体状态、血红蛋白、总蛋白、FIGO分期和病理类型等)的模型,预测结果优于只包含基本特征值的模型,也优于输入所有特征值的模型。因此,特征值的选取和输入并非越多越好,准确找到相关性较大的特征值进行组合,才能得到最佳的预测模型。Klement等[5]利用SVM和logistic分别建立早期非小细胞肺癌立体定向放疗(SBRT)后肿瘤控制率的预测模型。结果发现,含有多个特征值的SVM模型预测结果优于只有2个特征值的logistic模型。因此,筛选出最佳特征值进行组合输入模型,可以提高模型的预测精度。Naqa等[17]从56个原发非小细胞肺癌的患者中筛选了23个特征值,利用不同的算法模型对肿瘤控制率预测,发现利用SVM模型,能够揭示特征值之间重要的非线性复杂相互作用,预测结果同样优于logistic模型。
三、机器学习在预测放疗后并发症中的应用1.机器学习预测放射性肺炎:肺癌是我国发病率和死亡率第一的肿瘤[18],放疗在肺癌的综合治疗中具有重要地位[19],而放疗引起的放射性肺炎是危及患者生命的严重并发症之一[20]。现有的放射性肺炎预测模型,多数是基于剂量相关特征值建立的算法模型[21],较少有考虑患者临床特征值的异质性对预测结果的影响。有研究发现放射性肺炎发生、发展过程中伴随很多生物标记物的变化,通过检测这些生物标记物可以预测放射性肺炎[22]。Lee等[6]利用贝叶斯网络(Bayesian network)将放疗计划中的剂量相关特征值和生物标记物相关特征值同时纳入模型,预测放疗后发生放射性肺炎的风险,结果发现贝叶斯网络模型的预测精度要优于任何单个特征值或多个特征值的logistic回归模型。Valdes等[7]建立了I期非小细胞肺癌SBRT后放射性肺炎的预测模型,筛选了61个特征值,并将这61个特征值分为7类(合并症、药物、剂量学指标、分割与照射、分期、肿瘤位置、其他)。利用决策树对单个特征值分析,找到每个特征值引起放射性肺炎的阈值。Valdes等[7]发现可以通过增加新的特征值,增加算法的复杂度,以及扩大样本容量提高预测结果的精度。Das等[8]把Lyman和决策树结合在一起,建立放疗后放射性肺炎的预测模型。决策树考虑了剂量相关和非剂量相关的特征值,弥补了只用剂量相关特征值的缺陷,提高了预测精度。为了便于解释和传播,Das等[8]把经过交叉验证的模型提取形成一个简化的近似模型。Chen等[9-10]利用前馈神经网络(feed-forward neural network)和SVM两种算法,建立两个不同的放射性肺炎预测模型。数据来自235名接受放射治疗的肺癌患者,其中34名在随访中被诊断为2级肺炎。结果发现无论采用前馈神经网络还是SVM算法,加入非剂量相关特征值都可以显著提高模型的预测精度。陈辛元等[11]利用LKB(Lyman-Kutcher-Burman)建立非小细胞肺癌患者放疗后发生放射性肺损伤的预测模型,发现研究结果与国外文献报道存在一定差异,考虑是由于国内外放疗技术、治疗方案、疾病种类等因素不同影响预测结果。因此,相同的人群、治疗方式和手段等是LKB模型优化的关键因素。Su等[12]利用ANN算法建立放射性肺炎的预测模型,发现训练数据的质量同样影响模型的精度。
2.机器学习预测前列腺癌放疗后并发症:Pella等[23]利用ANN和SVM两种算法建立前列腺癌放疗后膀胱和直肠急性不良反应的预测模型,发现两者的预测精度相似,而SVM计算耗时较少。相对于SVM,ANN在预测不良反应的灵敏度上表现更好,可以为临床医疗决策提供有价值的支持。Gulliford等[13]利用ANN建立前列腺癌放疗后膀胱和直肠并发症的预测模型,敏感性和特异性≥55%。
四、讨论精确预测放疗疗效和并发症需要建立一个完善的模型,要全面考虑放射治疗过程中的每一步,包括非剂量相关(临床相关)因素和剂量相关(放疗计划和设备相关)因素。研究表明,将非剂量相关特征值和剂量相关特征值一起输入模型,可以显著提高模型的预测精度[8-10],增加模型中特征值的数量[5-10]、增加算法的复杂度、扩大样本容量即病例数[7]也可以提高模型预测的精度。Klement等[5]和Naqa等[17]发现,选择适当数目的特征值输入模型,比仅输入1~2个特征值得到的预测结果更精确。但是Ochi等[4]发现特征值并非越多越好,经过精细筛选、组合特征值后得到的模型,预测精度大于输入全部特征值而未筛选的模型。原因可能是无关特征值增大模型的计算量,导致模型在拟合过程中发生偏差,影响模型的预测结果。所以,建立模型前必须对输入特征值进行有效筛选。
目前,筛选特征值存在的问题是:①不同病种评价的特征值差异较大,如胸部放疗后放射性肺炎和腹部放疗后放射性肠炎的预测特征值迥异。②放疗相关的通用特征值缺乏全面、系统的总结。③特征值间的相互关系尚不明晰,如有些特征值之间是相互依存关系,单独一个特征值可能对预测结果没有影响,与其他特征值协同则发挥作用,在筛选过程中容易被遗漏。以上因素都会造成特征值提取和筛选的困难。解决方法:①按照放疗部位,将放疗后并发症的预测分为几个部分,如胸部、腹部、头颈等,分别提取相关特征值。②系统梳理患者放疗过程,提取全部通用特征值。③排列组合多个特征值,确定特征值间的关系。
目前,算法选择存在的问题是如何选择高效、高精度的算法。研究结果提示必须选择能够运算多个特征值的算法。而各个算法运算的速度和精度差异很大,更加精确的预测结果通常需要更长的运算时间。目前亟需一种能提高运算速度又不降低运算精度的算法。Das等[24]在预测放疗后引起的放射性肺炎时,融合了4种预测模型,大大提高了预测结果的精度,为机器学习建模提供了新的思路。Das等[24]利用决策树、神经网络、SVM和自组织映射(self-organizing maps)4种常见的非线性多元模型,预测219例接受放射治疗的肺癌患者发生放射性肺炎的风险。每一种模型都从患者的剂量和非剂量相关特征值中选取部分特征值,没有两种模型使用相同的特征值。然后将4个模型的预测结果进行简单平均,得到融合后的预测结果。结果显示,融合后的预测精度优于单一模型,方差也小于单一模型。
目前,样本数量和质量也存在问题:①有些病种放疗后并发症的发生率较低,样本收集较为困难,用于训练模型的样本量较小。②样本的质量较差,某些特征值项数据的缺失[6]。这些问题均会影响模型的训练。样本量足够大能够在一定程度上降低缺失值对预测结果的影响[6]。可以通过多中心合作、增加病例样本、严格放疗质控、提高样本质量来训练出完美的模型,提高预测精度。
机器学习在预测放疗后疗效和并发症中的应用十分广泛,而且精度也有令人兴奋的结果。相信随着算法的优化和模型的发展,机器学习的预测精度会进一步提高,在放疗中会有更为广阔的应用。机器学习将不仅局限用于放疗后结果的预测,还将广泛应用于放疗质量保证等领域。临床医学必须紧跟科学发展,将最先进的科学技术应用于临床,给患者提供最佳诊断和治疗。
利益冲突 全体作者没有任何利益冲突,未接受任何不当的职务或财务利益作者贡献声明 张书铭负责起草及修改论文;李佳奇、王皓、姜荣涛、隋婧、石成玉参与论文讨论与修改;杨瑞杰负责指导论文写作及论文修改
[1] |
Abernethy AP, Etheredge LM, Ganz PA, et al. Rapid-learning system for cancer care[J]. J Clin Oncol, 2010, 28(27): 4268-4274. DOI:10.1200/JCO.2010.28.5478 |
[2] |
Lambin P, van Stiphout RG, Starmans MH, et al. Predicting outcomes in radiation oncology-multifactorial decision support systems[J]. Nat Rev Clin Oncol, 2013, 10(1): 27-40. DOI:10.1038/nrclinonc.2012.196 |
[3] |
Bibault JE, Giraud P, Burgun A. Big data and machine learning in radiation oncology:State of the art and future prospects[J]. Cancer Lett, 2016, 382(1): 110-117. DOI:10.1016/j.canlet.2016.05.033 |
[4] |
Ochi T, Murase K, Fujii T, et al. Survival prediction using artificial neural networks in patients with uterine cervical cancer treated by radiation therapy alone[J]. Int J Clin Oncol, 2002, 7(5): 294-300. DOI:10.1007/s101470200043 |
[5] |
Klement RJ, Allgäuer M, Appold S, et al. Support vector machine based prediction of local tumor control after stereotactic body radiation therapy for early-stage non-small cell lung cancer[J]. Int J Radiat Oncol Biol Phys, 2014, 88(3): 732-738. DOI:10.1016/j.ijrobp.2013.11.216 |
[6] |
Lee S, Ybarra N, Jeyaseelan K, et al. Bayesian network ensemble as a multivariate strategy to predict radiation pneumonitis risk[J]. Med Phys, 2015, 42(5): 2421-2430. DOI:10.1118/1.4915284 |
[7] |
Valdes G, Solberg TD, Heskel M, et al. Using machine learning to predict radiation pneumonitis in patients with stage I non-small cell lung cancer treated with stereotactic body radiation therapy[J]. Phys Med Biol, 2016, 61(16): 6105-6120. DOI:10.1088/0031-9155/61/16/6105 |
[8] |
Das SK, Zhou S, Zhang J, et al. Predicting lung radiotherapy-induced pneumonitis using a model combining parametric Lyman probit with nonparametric decision trees[J]. Int J Radiat Oncol Biol Phys, 2007, 68(4): 1212-1221. DOI:10.1016/j.ijrobp.2007.03.064 |
[9] |
Chen S, Zhou S, Zhang J, et al. A neural network model to predict lung radiation-induced pneumonitis[J]. Med Phys, 2007, 34(9): 3420-3427. DOI:10.1118/1.2759601 |
[10] |
Chen S, Zhou S, Yin FF, et al. Investigation of the support vector machine algorithm to predict lung radiation-induced pneumonitis[J]. Med Phys, 2007, 34(10): 3808-3814. DOI:10.1118/1.2776669 |
[11] |
陈辛元, 孙帅, 王绿化, 等. 探讨NSCLC放射性肺损伤NTCP模型的建立[J]. 中华放射肿瘤学杂志, 2017, 26(12): 1376-1380. Chen XY, Sun S, Wang LH, et al. Establishment of the NTCP model for radiation-induced lung injury in patients with non-small cell lung cancer[J]. Chin J Radiat Oncol, 2017, 26(12): 1376-1380. DOI:10.3760/cma.j.issn.1004-4221.2017.12.004 |
[12] |
Su M, Miften M, Whiddon C, et al. An artificial neural network for predicting the incidence of radiation pneumonitis[J]. Med Phys, 2005, 32(2): 318-325. DOI:10.1118/1.1835611 |
[13] |
Gulliford SL, Webb S, Rowbottom CG, et al. Use of artificial neural networks to predict biological outcomes for patients receiving radical radiotherapy of the prostate[J]. Radiother Oncol, 2004, 71(1): 3-12. DOI:10.1016/j.radonc.2003.03.001 |
[14] |
Quinlan JR. Induction of decision trees[J]. Mach Learn, 1986, 1(1): 81-106. DOI:10.1023/A:1022643204877 |
[15] |
LeCun Y, Bengio Y, Hinton G. Deep learning[J]. Nature, 2015, 521(7553): 436-444. DOI:10.1038/nature14539 |
[16] |
Kang J, Schwartz R, Flickinger J, et al. Machine learning approaches for predicting radiation therapy outcomes:a clinician's perspective[J]. Int J Radiat Oncol Biol Phys, 2015, 93(5): 1127-1135. DOI:10.1016/j.ijrobp.2015.07.2286 |
[17] |
Naqa IE, Deasy JO, Mu Y, et al. Datamining approaches for modeling tumor control probability[J]. Acta Oncol, 2010, 49(8): 1363-1373. DOI:10.3109/02841861003649224 |
[18] |
Chen W, Zheng R, Baade PD, et al. Cancer statistics in China, 2015[J]. CA Cancer J Clin, 2016, 66(2): 115-132. DOI:10.3322/caac.21338 |
[19] |
Tyldesley S, Boyd C, Schulze K, et al. Estimating the need for radiotherapy for lung cancer:an evidence-based, epidemiologic approach[J]. Int J Radiat Oncol Biol Phys, 2001, 49(4): 973-985. DOI:10.1016/S0360-3016(00)01401-2 |
[20] |
Kong FM, Hayman JA, Griffith KA, et al. Final toxicity results of a radiation-dose escalation study in patients with non-small-cell lung cancer (NSCLC):predictors for radiation pneumonitis and fibrosis[J]. Int J Radiat Oncol Biol Phys, 2006, 65(4): 1075-1086. DOI:10.1016/j.ijrobp.2006.01.051 |
[21] |
Marks LB, Bentzen SM, Deasy JO, et al. Radiation dose-volume effects in the lung[J]. Int J Radiat Oncol Biol Phys, 2010, 76(3 Suppl): S70-76. DOI:10.1016/j.ijrobp.2009.06.091 |
[22] |
Oh JH, Craft JM, Townsend R, et al. A bioinformatics approach for biomarker identification in radiation-induced lung inflammation from limited proteomics data[J]. J Proteome Res, 2011, 10(3): 1406-1415. DOI:10.1021/pr101226q |
[23] |
Pella A, Cambria R, Riboldi M, et al. Use of machine learning methods for prediction of acute toxicity in organs at risk following prostate radiotherapy[J]. Med Phys, 2011, 38(6): 2859-2867. DOI:10.1118/1.3582947 |
[24] |
Das SK, Chen S, Deasy JO, et al. Combining multiple models to generate consensus:application to radiation-induced pneumonitis prediction[J]. Med Phys, 2008, 35(11): 5098-5109. DOI:10.1118/1.2996012 |