2. 苏州寻正医学科技有限公司研发部, 苏州 215000;
3. 国家癌症中心 国家肿瘤临床医学研究中心 中国医学科学院北京协和医学院肿瘤医院特需医疗部, 北京 100021
2. Suzhou Xunzheng Medical Technology Co., Ltd. Department of Research and Development, Suzhou 215000, China;
3. Department of VIP Medical Services, National Cancer Center, National Clinical Research Center for Cancer, Cancer Hospital, Chinese Academy of Medical Sciences and Peking Union Medical College, Beijing 100021, China
我国每年新增癌症患者约430万,每年死亡约280万,且呈现逐年攀升的趋势,癌症已成为我国患者的头号死因[1-2]。放射治疗是癌症的主要治疗手段之一,尤其是进入21世纪,放疗技术突飞猛进,其作用越来越重要[3]。
放疗的实施过程主要以计算机为载体,数据量大,电子化、结构化程度高,故在人工智能(artificial intelligence,AI)的应用领域有得天独厚的优势。近年来,以机器学习(machine learning,ML)为代表的AI飞速发展[4],让放疗如虎添翼。我国放疗平均发展水平落后,地区间、城乡间放疗水平差异大。ML在放疗领域有着广泛应用,将很好地弥补差距,提升我国放疗整体水平。
一、机器学习简介ML是AI的一个分支,指的是计算机通过运用数据及统计方法提高系统性能。根据学习数据是否含有标记(label),ML可分为监督学习(supervised learning)、无监督学习(unsupervised learning),以及将两者结合的半监督学习(semi-supervised learning)[5]。ML的代表性算法,包括逻辑回归(logistic regression)、决策树(decision trees)、贝叶斯分类器(Bayesian classifiers)、随机森林(random forest)、神经网络(neural network,NN)、支持向量机(support vector machine,SVM)等,在医学领域常用的是神经网络和支持向量机[6]。神经网络首尾两层分别是输入层和输出层,中间为隐藏层。隐藏层数很多的神经网络,称作“深度神经网络”(deep neural network,DNN)。DNN中最值得关注的是卷积神经网络(convolutional neural network,CNN)和循环神经网络(recurrent neural network, RNN)。CNN目前在各领域广泛应用,在医学领域的成功应用包括利用照片诊断皮肤癌、利用X射线片筛查乳腺癌、利用影像信息诊断肺炎和眼病等。RNN可深度挖掘和分析医疗文本的信息,将非结构化文本形式的病历数据变成标准化和结构化的数据[7]。
二、机器学习在放射治疗中的临床应用现状ML可应用于放射治疗临床实践的各个环节,包括临床决策支持、自动勾画靶区、预测疗效和副反应等。
1. 临床决策支持系统
(1) 选择治疗方案。Kann等[8]利用CT(computed tomography)影像训练CNN,来判断头颈部鳞癌淋巴结的结外侵犯,CNN判断准确率(area under curve,AUC=0.84)明显优于两名影像专家(AUC=0.70、0.71),有助于更准确地选择治疗方案。刘渊等[9]采用ML判断鼻咽癌淋巴结转移,准确率达86%,有助于放疗靶区的精确勾画。Mattonen等[10]利用CT影像训练ML,检测肺癌立体定向放疗后的复发,以尽早行挽救治疗。利用整个随访过程中的所有影像,ML与医生对复发的判断准确率总体相仿,但对于放疗后6个月内复发的早期预测,ML(错误率24%,假阴性率23%)显著优于医生(错误率35%,假阴性率99%),提示肉眼不易看到的细微的影像学改变,可能是局部复发的早期指标,可以被ML有效利用。Zhou等[11]训练ML能通过增强T1WI影像检测到几乎所有直径≥6 mm的脑转移瘤,并具有较低的假阳性率,有利于尽早行头部立体定向放射治疗。
(2) 选择放疗技术。质子治疗因布拉格峰而具有较好的剂量分布特征,但费用昂贵。Langendijk等[12]采用ML模拟质子治疗的剂量分布,用于预测正常组织并发症概率,以选择适合质子放疗的患者,目前已在荷兰应用于临床。Hall等[13]也做了类似研究,训练ML来预测颅底肿瘤质子放疗危及器官受量,预测受量与实际受量一致性好(皮尔逊相关系数=93%);将预测受量与调强放射治疗的危及器官受量进行比较,预测新患者进行质子放疗是否能够减少危及器官受量,以确定其是否适合质子放疗。
(3) 确定放疗剂量的取舍。Tol等[14]利用由患者放疗计划组成的数据库训练神经网络,来预测新患者能够达到的危及器官受量;Valdes等[15]则更进一步,使用既往放疗计划数据训练ML,除了可以让医生提前判断危及器官的受量,还可以辅助进行相邻器官(如肺和心脏)的剂量取舍。
2. 自动勾画靶区:放疗专家勾画靶区,用时较多,且不同专家勾画的靶区差异明显,影响精确性与一致性。危及器官比肿瘤靶区变异性小,ML更容易实施,故早期研究多集中在自动勾画危及器官。自动勾画主要分为两种,基于图谱的自动勾画(atlas based automatic contouring)和基于深度学习的自动勾画(deep learning based automatic contouring)。
基于图谱的自动勾画出现较早,其原理是预先建立一套或几套危及器官模板,ML自动匹配合适的模板[16]。然而不同患者解剖结构差异大,模板难以覆盖所有情况。准备多套模板可以提高勾画准确度,但计算量大大增加,耗时增多,故要在准确度与速度之间进行平衡。基于深度学习的自动勾画则无需上述折衷,因为其原理是利用CNN进行特征学习,输入越多模板,学习的特征就越准确,所以带来了准确度与速度的双重提升。对于肺、肝、心脏等变异性较小的危及器官,基于深度学习和基于图谱的自动勾画准确度与速度相当;对于食管、脊髓等变异性较大的器官,基于深度学习的自动勾画优势明显[16-17]。
在肿瘤靶区勾画方面,Lin等[18]训练三维CNN在MRI(magnetic resonance imaging)影像上勾画鼻咽癌大体肿瘤靶区(gross tumor volume,GTV),与专家勾画的GTV相似度高,Dice相似系数(dice similarity coefficient,DSC)达0.79;医生经过ML辅助,用时减少39.4%,准确度有所提升(DSC, 0.74 vs. 0.78,P < 0.001)。三维CNN不仅利用传统CNN提取的每一层CT图像信息,而且利用层与层之间的信息,信息利用率高,准确度有一定提升。临床肿瘤靶区因为涉及亚临床病灶和临床预防区域,自动勾画相对更难,DNN的表现与专家相比还有差距(DSC, 0.72 vs. 0.79)[19]。近年来研究集中在基于深度学习的靶区自动勾画。
ML在自动勾画靶区领域取得了明显进展,可作为工作流程的一部分,但目前仍需医生审核与修正。进一步发展,ML自动评价靶区勾画质量,不合格者再由医生修正[20]。ML完全取代医生勾画靶区尚需时日。
3. 预测放疗疗效和不良反应:ML利用输入的多个变量来预测放疗疗效和副反应,预测能力明显优于医生。目前研究多基于临床变量和影像,而将两者结合起来的研究较少。早期研究以使用临床变量为主,Klement等[21]使用支持向量机预测早期肺癌立体定向放射治疗后局部失败情况,准确性优于逻辑回归(AUC, 0.79 vs. 0.68)。Oberije等[22]使用ML来预测肺癌患者放疗后生存情况,以及呼吸困难、吞咽困难等不良反应,尽管ML只基于5~7个变量,而医生可以利用患者所有的信息,ML准确度仍优于医生(AUC,0.71 vs. 0.56,P=0.02)。Luo等[23]多种临床变量,包括放疗剂量参数、基因表达情况、细胞因子,训练贝叶斯网络,结果显示单纯使用放疗前的参数AUC为0.78;而使用放疗前后的参数,AUC提高至0.82。
近两年研究集中在利用放射组学特征预测放疗疗效。Lou等[24]使用肺癌放疗前的CT图像训练DNN,预测肺癌局部复发概率,分为高风险和低风险两组,3年累计局部复发率分别为20.3%和5.7%(P < 0.0001)。Li等[25]使用无监督学习将肺癌放疗患者聚类,分为高、中、低风险3组,其中高风险组与低风险组总生存有差别(P=0.041), 提示无监督学习在风险分层方面有着良好的应用前景。Aneja等[26]将影像组学与临床变量结合,预测非小细胞肺癌立体定向放疗后局部控制失败,该研究比较了深度学习、随机森林、支持向量机和逻辑回归的预测能力,结果显示深度学习明显优于其余三者,一致性指数分别为0.81、0.69、0.65、0.59。此外,病理图像因电子化程度较影像低,ML的应用相对较晚,目前利用病理图像预测放疗疗效和副反应的研究较少。Yu等[27]用病理图像训练多种ML算法,将I期非小细胞肺癌患者分为高、低风险两组,两组生存有显著差别(P=0.035)。
ML在放疗临床应用广泛,算法目前已到平台期,改进的余地不大,未来的发展方向是应用更多维度的变量和更庞大的样本量,以提高ML的预测效果。此外,ML在模拟定位图像处理[28]、放疗计划优化[29]、质量控制[30]等方面也有着极其广泛的应用。
三、挑战与解决之道1.数据缺乏:在医疗领域,ML应用的最大障碍是缺乏足够的结构化数据。面对大数据,深度神经网络准确度明显优于其他机器学习算法;但小样本数据,支持向量机、随机森林等一般会比神经网络准确性高。因此,要根据样本量,开发、选择合适的算法。此外,分布式学习(distributed learning)和迁移学习(transfer learning)也为数据缺乏问题提供了一些解决思路。
患者数据在不同的医院内部很容易获得,但因为隐私、数据安全等问题,医院之间共享数据受到道德、行政、法律等的阻碍[31]。与集中式学习相对应,分布式学习是在数据不离开医院的情况下,从多个医院的数据中学习。Jochems等[32]使用来自5家医疗机构的数据训练贝叶斯网络,预测肺癌放疗后呼吸困难,证实了分布式学习的可行性。分布式机器学习的关键是如何把要处理的大数据或大模型进行切分,在多个机器上做并行训练。Jochems等[33]在另外一项研究中利用分布式学习,使用位于3个国家的3家医院的数据来训练贝叶斯网络,预测肺癌患者的2年生存率,结果显示分布式学习与集中学习效果差异无统计学意义(P=0.26)。
迁移学习是先用任务A的数据训练模型,作为初始化参数用于任务B模型的训练,主要目的是模型重用,即将任务A的模型通过少量的修改应用到任务B[34]。迁移学习在放疗领域已有探索,Zhen等[35]采用基于CNN的迁移学习模型预测宫颈癌放疗引起的直肠并发症;Li等[36]采用迁移学习训练DNN,自动勾画肺癌的内靶区(ITV)。
另外,要转变数据收集的观念,不仅要从现有数据尽可能多地挖掘信息,而且要有计划地产生和采集数据,让数据自动结构化,从源头上解决现有结构化数据不足的问题[37]。
2.模型的可解释性:临床判断通常基于人类可以理解的逻辑关系,但DNN是个“黑箱”模型,它将输入变量与输出变量连接起来,其内部规律却难以得知。一般来说,更准确的模型,例如随机森林和神经网络通常是不可理解的;而可理解的模型,例如逻辑回归、贝叶斯网络和决策树,则准确性明显下降,所以需要在准确性和可解释性之间折衷。Caruana等[38]使用ML评估肺炎患者严重程度,ML认为合并哮喘的肺炎患者危险度较低,这与临床经验不符。事后分析,是合并哮喘的肺炎患者会直接转到重症监护病房(ICU),经过积极治疗后,其预后优于普通肺炎,而不是其危险度低。发展可解释性模型是一个解决办法。Valdes等[39]改良了决策树,在13个医疗数据集上测试结果,在保证可解释性的前提下,其准确性与解释性差的ML模型相当,并优于传统的决策树算法。
四、总结与展望ML可应用于放疗临床的各个环节,包括临床决策支持、自动勾画靶区、预测疗效和副反应等。尽管面临着数据缺乏和模型的解释性等问题,随着技术进步和应用推广,以ML为代表的AI将应用于放疗临床的整个流程,提高效率与准确性,带来放疗领域的变革。凭借稳定而出色的表现,ML将赢得医生和患者的信赖。
利益冲突 无所有作者均声明不存在利益冲突,排名无争议,未因进行该研究而接受任何不正当的职务和财务利益
志谢 本研究还受到苏州高新区科技项目(2017Z001)的资助
作者贡献声明 马泽良负责文献调研、整理文献和论文撰写;门阔、蒋海行负责论文修改;惠周光负责整体论文指导及修改
[1] |
Chen W, Zheng R, Baade PD, et al. Cancer statistics in China, 2015[J]. CA Cancer J Clin, 2016, 66(2): 115-132. DOI:10.3322/caac.21338 |
[2] |
郑荣寿, 孙可欣, 张思维, 等. 2015年中国恶性肿瘤流行情况分析[J]. 中华肿瘤杂志, 2019, 41(1): 19-28. Zheng RS, Sun KX, Zhang SW, et al. Report of cancer epidemiology in China, 2015[J]. Chin J Oncol, 2019, 41(1): 19-28. DOI:10.3760/cma.j.issn.0253-3766.2019.01.008 |
[3] |
乔延伟. 肿瘤精确放疗技术发展及应用现状[J]. 中国医疗设备, 2014(7): 73-76. Qiao YW. Development and application situations of precise and accurate radiotherapy techniques for tumors[J]. China Med Devic, 2014(7): 73-76. DOI:10.3969/j.issn.1674-1633.2014.07.026 |
[4] |
Jordan MI, Mitchell TM. Machine learning: Trends, perspectives, and prospects[J]. Science, 2015, 349(6245): 255-260. DOI:10.1126/science.aaa8415 |
[5] |
LeCun Y, Bengio Y, Hinton G. Deep learning[J]. Nature, 2015, 521(7553): 436-444. DOI:10.1038/nature14539 |
[6] |
Jiang F, Jiang Y, Zhi H, et al. Artificial intelligence in healthcare: past, present and future[J]. Stroke Vasc Neurol, 2017, 2(4): 230-243. DOI:10.1136/svn-2017-000101 |
[7] |
Liang H, Tsui BY, Ni H, et al. Evaluation and accurate diagnoses of pediatric diseases using artificial intelligence[J]. Nat Med, 2019, 25(3): 433-438. DOI:10.1038/s41591-018-0335-9 |
[8] |
Kann BH, Hicks DF, Payabvash S, et al. Multi-institutional validation of deep learning for pretreatment identification of extranodal extension in head and neck squamous cell carcinoma[J]. J Clin Oncol, 2020, 38(12): 1304-1311. DOI:10.1200/JCO.19.02031 |
[9] |
刘渊, 程玉玉, 贺睿敏, 等. 基于机器学习的鼻咽癌转移淋巴结鉴别模型[J]. 中国医学物理学杂志, 2019, 36(11): 1350-1355. Liu Y, Cheng YY, He RM, et al. Machine learning-based classification model of lymph node metastasis in nasopharyngeal carcinoma[J]. Chin J Med Phys, 2019, 36(11): 1350-1355. DOI:10.3969/j.issn.1005-202X.2019.11.020 |
[10] |
Mattonen SA, Palma DA, Johnson C, et al. Detection of local cancer recurrence after stereotactic ablative radiation therapy for lung cancer: physician performance versus radiomic assessment[J]. Int J Radiat Oncol Biol Phys, 2016, 94(5): 1121-1128. DOI:10.1016/j.ijrobp.2015.12.369 |
[11] |
Zhou Z, Sanders JW, Johnson JM, et al. Computer-aided detection of brain metastases in T1-weighted MRI for stereotactic radiosurgery using deep learning single-shot detectors[J]. Radiology, 2020, 295(2): 407-415. DOI:10.1148/radiol.2020191479 |
[12] |
Langendijk JA, Lambin P, De Ruysscher D, et al. Selection of patients for radiotherapy with protons aiming at reduction of side effects: the model-based approach[J]. Radiother Oncol, 2013, 107(3): 267-273. DOI:10.1016/j.radonc.2013.05.007 |
[13] |
Hall DC, Trofimov AV, Winey BA, et al. Predicting patient-specific dosimetric benefits of proton therapy for skull-base tumors using a geometric knowledge-based method[J]. Int J Radiat Oncol Biol Phys, 2017, 97(5): 1087-1094. DOI:10.1016/j.ijrobp.2017.01.236 |
[14] |
Tol JP, Delaney AR, Dahele M, et al. Evaluation of a knowledge-based planning solution for head and neck cancer[J]. Int J Radiat Oncol Biol Phys, 2015, 91(3): 612-620. DOI:10.1016/j.ijrobp.2014.11.014 |
[15] |
Valdes G, Simone CB 2nd, Chen J, et al. Clinical decision support of radiotherapy treatment planning: A data-driven machine learning strategy for patient-specific dosimetric decision making[J]. Radiother Oncol, 2017, 125(3): 392-397. DOI:10.1016/j.radonc.2017.10.014 |
[16] |
Lustberg T, van Soest J, Gooding M, et al. Clinical evaluation of atlas and deep learning based automatic contouring for lung cancer[J]. Radiother Oncol, 2018, 126(2): 312-317. DOI:10.1016/j.radonc.2017.11.012 |
[17] |
张富利, 崔德琪, 王秋生, 等. 基于深度学习和图谱库方法自动勾画肿瘤放疗中危及器官的比较[J]. 中国医学物理学杂志, 2019, 36(12): 1486-1490. Zhang FL, Cui DQ, Wang QS, et al. Comparative study of deep learning-versus Atlas-based auto-segmentation of organs-at-risk in tumor radiotherapy[J]. Chin J Med Phys, 2019, 36(12): 1486-1490. DOI:10.3969/j.issn.1005-202X.2019.12.024 |
[18] |
Lin L, Dou Q, Jin YM, et al. Deep learning for automated contouring of primary tumor volumes by MRI for nasopharyngeal carcinoma[J]. Radiology, 2019, 291(3): 677-686. DOI:10.1148/radiol.2019182012 |
[19] |
Wong J, Fong A, McVicar N, et al. Comparing deep learning-based auto-segmentation of organs at risk and clinical target volumes to expert inter-observer variability in radiotherapy planning[J]. Radiother Oncol, 2020, 144: 152-158. DOI:10.1016/j.radonc.2019.10.019 |
[20] |
Zhang Y, Plautz TE, Hao Y, et al. Texture-based, automatic contour validation for online adaptive replanning: A feasibility study on abdominal organs[J]. Med Phys, 2019, 46(9): 4010-4020. DOI:10.1002/mp.13697 |
[21] |
Klement RJ, Allgäuer M, Appold S, et al. Support vector machine-based prediction of local tumor control after stereotactic body radiation therapy for early-stage non-small cell lung cancer[J]. Int J Radiat Oncol Biol Phys, 2014, 88(3): 732-738. DOI:10.1016/j.ijrobp.2013.11.216 |
[22] |
Oberije C, Nalbantov G, Dekker A, et al. A prospective study comparing the predictions of doctors versus models for treatment outcome of lung cancer patients: a step toward individualized care and shared decision making[J]. Radiother Oncol, 2014, 112(1): 37-43. DOI:10.1016/j.radonc.2014.04.012 |
[23] |
Luo Y, El Naqa I, McShan DL, et al. Unraveling biophysical interactions of radiation pneumonitis in non-small-cell lung cancer via Bayesian network analysis[J]. Radiother Oncol, 2017, 123(1): 85-92. DOI:10.1016/j.radonc.2017.02.004 |
[24] |
Lou B, Doken S, Zhuang T, et al. An image-based deep learning framework for individualizing radiotherapy dose[J]. Lancet Digit Health, 2019, 1(3): e136-136e147. DOI:10.1016/S2589-7500(19)30058-5 |
[25] |
Li H, Galperin-Aizenberg M, Pryma D, et al. Unsupervised machine learning of radiomic features for predicting treatment response and overall survival of early stage non-small cell lung cancer patients treated with stereotactic body radiation therapy[J]. Radiother Oncol, 2018, 129(2): 218-226. DOI:10.1016/j.radonc.2018.06.025 |
[26] |
Aneja S, Shaham U, Kumar RJ, et al. Deep neural network to predict local failure following stereotactic body radiation therapy: Integrating imaging and clinical data to predict outcomes[J]. Int J Radiat Oncol Biol Phys, 2017, 99(2): S47. DOI:10.1016/j.ijrobp.2017.06.120 |
[27] |
Yu KH, Zhang C, Berry GJ, et al. Predicting non-small cell lung cancer prognosis by fully automated microscopic pathology image features[J]. Nat Commun, 2016, 7: 12474. DOI:10.1038/ncomms12474 |
[28] |
张艺宝, 蒋璠, 岳海振, 等. 利用VMAT模型基于知识IMRT计划半自动优化[J]. 中华放射肿瘤学杂志, 2017, 26(2): 178-181. Zhang YB, Jiang P, Yue HZ, et al. Knowledge-based semi-automated optimization of intensity-modulated radiotherapy plans using a volume modulated arc therapy-configured model[J]. Chin J Radiat Oncol, 2017, 26(2): 178-181. DOI:10.3760/cma.j.issn.1004-4221.2017.02.012 |
[29] |
程志垚, 李定杰, 吴慧, 等. MdaccAutoPlan软件在鼻咽癌调强放疗计划设计的应用分析[J]. 中华放射医学与防护杂志, 2018, 38(4): 285-290. Cheng ZY, Li DJ, Wu H, et al. Clinical application of MdaccAutoPlan in the planning of nasopharyngeal carcinoma with intensity modulated radiotherapy[J]. Chin J Radiol Med Prot, 2018, 38(4): 285-290. DOI:10.3760/cma.j.issn.0254-5098.2018.04.008 |
[30] |
孔繁图, 麦燕华, 亓孟科, 等. 基于神经网络学习方法的放疗计划三维剂量分布预测[J]. 南方医科大学学报, 2018, 38(6): 683-690. Kong FT, Mai YH, Qi MK, et al. Prediction of three-dimensional dose distribution in intensity-modulated radiation therapy based on neural network learning[J]. J South Med Univers, 2018, 38(6): 683-690. DOI:10.3969/j.issn.1673-4254.2018.06.07 |
[31] |
Doshi P, Jefferson T, Del Mar C. The imperative to share clinical study reports: recommendations from the Tamiflu experience[J]. PLoS Med, 2012, 9(4): e1001201. DOI:10.1371/journal.pmed.1001201 |
[32] |
Jochems A, Deist TM, van Soest J, et al. Distributed learning: Developing a predictive model based on data from multiple hospitals without data leaving the hospital - A real life proof of concept[J]. Radiother Oncol, 2016, 121(3): 459-467. DOI:10.1016/j.radonc.2016.10.002 |
[33] |
Jochems A, Deist TM, El Naqa I, et al. Developing and validating a survival prediction model for NSCLC patients through distributed learning across 3 countries[J]. Int J Radiat Oncol Biol Phys, 2017, 99(2): 344-352. DOI:10.1016/j.ijrobp.2017.04.021 |
[34] |
Pan SJ, Yang Q. A survey on transfer learning[J]. IEEE Trans Knowl Data Eng, 2010, 22(10): 1345-1359. DOI:10.1109/tkde.2009.191 |
[35] |
Zhen X, Chen J, Zhong Z, et al. Deep convolutional neural network with transfer learning for rectum toxicity prediction in cervical cancer radiotherapy: a feasibility study[J]. Phys Med Biol, 2017, 62(21): 8246-8263. DOI:10.1088/1361-6560/aa8d09 |
[36] |
Li X, Deng Z, Deng Q, et al. A novel deep learning framework for internal gross target volume definition from 4d computed tomography of lung cancer patients[J]. IEEE Access, 2018, 6: 37775-37783. DOI:10.1109/ACCESS.2018.2851027 |
[37] |
Mayo CS, Kessler ML, Eisbruch A, et al. The big data effort in radiation oncology: Data mining or data farming?[J]. Adv Radiat Oncol, 2016, 1(4): 260-271. DOI:10.1016/j.adro.2016.10.001 |
[38] |
Caruana R, Lou Y, Gehrke J, et al. Intelligible models for healthcare[C]. Proceedings of the 21th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining-KDD'15. 2015: 1721-1730. DOI: 10.1145/2783258.2788613.
|
[39] |
Valdes G, Luna JM, Eaton E, et al. MediBoost: a patient stratification tool for interpretable decision making in the era of precision medicine[J]. Sci Rep, 2016, 6: 37854. DOI:10.1038/srep37854 |