中华放射医学与防护杂志  2023, Vol. 43 Issue (9): 736-740   PDF    
深度学习重建算法改善颅脑低剂量CT图像质量的可行性研究
崔津津 , 刘贯中 , 胡兴和 , 韩邵军 , 孙红 , 王新江 , 姚洪祥     
国家老年疾病临床医学研究中心 解放军总医院第二医学中心放射诊断科, 北京 100853
[摘要] 目的 探讨深度学习重建算法(DLIR)较自适应统计迭代重建(ASIR-V)算法在改善颅脑低剂量CT图像质量方面的效果。方法 回顾性纳入2021年11月至2022年8月在解放军总医院第二医学中心接受颅脑CT检查的患者,对所有患者的低剂量CT采用4种不同算法重建:获得30%强度ASIR-V(ASIR-V-30%)图像、低强度DLIR(DLIR-L)图像、中等强度DLIR(DLIR-M)图像和高强度DLIR(DLIR-H)图像。在4组图像的表浅白质、表浅灰质、深部白质和深部灰质内选取感兴趣区并测量其CT值,计算信噪比(SNR)和对比噪声比(CNR)。由3名神经影像医师按照Likert 5分量表对图像质量进行主观评分。对4组图像的客观、主观评分进行分析,若总体存在差异,则进行组内两两比较。结果 共纳入109例患者,男104例、女5例,年龄65~110岁,平均(89.16±9.53)岁。颅脑CT低剂量扫描的辐射剂量为(0.93±0.01)mSv,显著低于常规扫描(2.92±0.01)mSv(t=56.15,P < 0.05)。颅脑低剂量CT的4组图像的SNR深部灰质、SNR深部白质、SNR表浅灰质、SNR表浅白质、CNR深部灰白质、CNR表浅灰白质客观图像质量分析差异具有统计学意义(F=98.23、72.95、68.43、58.24、241.13、289.91,P < 0.05),其中DLIR-H图像在深部灰质、深部白质、表浅灰质、表浅白质中噪声最低,与其他图像组间差异有统计学意义(t=167.43、275.46、182.32、361.54,P < 0.05)。DLIR-H图像质量主观评分优于ASIR-V-30%、DLIR-L、DLIR-M,且差异具有统计学意义(t=7.25、8.32、9.63,P < 0.05)。结论 与ASIR-V相比,DLIR算法能够有效降低颅脑低剂量CT的图像噪声和伪影,并提高SNR和CNR,其中DLIR-H图像质量最佳。
[关键词] 深度学习重建算法    迭代重建    低辐射剂量    图像质量    腔隙性梗死灶    
Feasibility study on deep learning image reconstruction algorithm to improve the quality of low-dose CT images of the brain
Cui Jinjin , Liu Guanzhong , Hu Xinghe , Han Shaojun , Sun Hong , Wang Xinjiang , Yao Hongxiang     
National Clinical Research Center for Geriatric Diseases, Department of Radiology, the Second Medical Center of the PLA General Hospital, Beijing 100853, China
[Abstract] Objective To explore the effectiveness of deep learning image reconstruction (DLIR) algorithm compared to adaptive statistical iterative reconstruction (ASIR-V) algorithm in improving the quality of low-dose brain CT images. Methods Retrospective inclusion of patients who underwent brain CT examination in the People's Liberation Army General Hospital from November 2021 to August 2022. Four different algorithms were used to reconstruct low-dose CT scans of all patients to obtain 30% intensity ASIR-V (ASIR-V-30%) images, low intensity DLIR (DLIR-L) images, medium intensity DLIR (DLIR-M) images, and high intensity DLIR (DLIR-H) images. The regions of interest were selected from four sets of images, including superficial white matter, superficial gray matter, deep white matter, and deep gray matter, and their CT values and standard deviations were measured for calculating signal-to-noise ratio (SNR) and contrast-to-noise ratio (CNR).Subjective evaluation of image quality was conducted by three neuroimaging physicians based on the Likert 5-component scale. The objective and subjective scores of the 4 groups of images were analyzed using ANOVA or Kruskal Wallis. If there are overall differences, pairwise comparisons were conducted within the group. Results A total of 109 patients were enrolled, including 104 males and 5 females, aged 65-110 years (89.16 ±9.53) years. The radiation exposure of brain CT low-dose scanning was (0.93 ±0.01)mSv, significantly lower than that of conventional scanning (2.92 ±0.01) mSv (t=56.15, P < 0.05). The differences in objective image quality analysis of ASIR-V-30%, DLIR-L, DLIR-M, and DLIR-H images of low-dose CT in SNRdeep gray matter, SNR deep white matter, SNR superficial gray matter, SNR superficial white matter, CNR deep gray white matter, and CNRsuperficial gray white matter were statistically significant(F=98.23, 72.95, 68.43, 58.24, 241.13, 289.91, P < 0.05). Among them, DLIR-H images had the lowest noise in deep gray matter, deep white matter, superficial gray matter, and superficial white matter, and had statistically significant differences compared to other image groups (t=167.43, 275.46, 182.32, 361.54, P < 0.05). The subjective score of DLIR-H image quality was superior to ASIR-V-30%, DLIR-L, and DLIR-M, with the statistically significant difference (t=7.25, 8.32, 9.63, P < 0.05). Conclusions Compared with ASIR-V, DLIR algorithm can effectively reduce image noise and artifacts in low-dose brain CT, and improve SNR and CNR. The subjective and objective image quality evaluation of DLIR-H is the best.
[Key words] Deep learning image reconstruction    Adaptive statistical iterative reconstruction-V    Low radiation dose    Image quality    Lacunar infarction    

CT检查具有快捷、方便、成本低等优势,已成为当前全球筛查脑血管疾病的首选检查方法[1]。颅脑CT因扫描范围包含了眼晶状体等辐射敏感器官,因此降低辐射剂量尤为重要。降低辐射剂量最直接的办法是优化扫描条件(如kVp、mAs等),但传统的滤波反投影(FBP)算法在降低扫描条件后,图像噪声明显增加,图像质量降低[2]。自适应统计迭代重建(ASIR)算法可以降低图像噪声,在低剂量扫描条件下能够与常规剂量下FBP重建图像的质量相当。然而,ASIR算法在空间分辨率、噪声纹理与病变检测等方面有一定局限性,限制了其进一步减少辐射剂量的潜力[3]。美国通用电气(GE)医疗研发的深度学习图像重建(deep learning image reconstruction, DLIR)算法,即TrueFidelityTM深度学习重建,以高质量FBP数据集作为训练目标,能够学习如何将噪声与信号区分开,并在不影响图像噪声纹理的情况下有效地抑制噪声。当前,DLIR算法已被用于模体和各项临床研究,但在头部的应用较少。因此,本研究旨在探讨DLIR改善低剂量颅脑CT图像质量方面的能力。

资料与方法

1. 病例资料:回顾性纳入解放军总医院第二医学中心2021年11月至2022年8月间符合条件的109例患者患者作为研究对象。纳入标准:可以完成颅脑CT扫描的患者。排除标准包括:脑出血患者;既往大面积脑梗死患者;肿瘤患者;头动伪影明显的患者;头部有金属植入物伪影的患者;存在其他疾病影响影像诊断的患者。本研究获得医院伦理委员会的批准,患者数据经过脱敏处理,所有患者或监护人均签署了知情同意书。

2. 仪器与方法:使用GE Revolution APEX CT扫描仪(GE Healthcare, Milwaukee, 美国),受检者取仰卧位。每名患者进行2颅脑CT扫描,第1次为常规剂量扫描,扫描参数如下:管电压120 kV,自动管电流454 mA(自动管电流),光束准直64 × 0.625 mm,转速0.5 s/周,螺距0.516,视野(FOV)250 mm × 250 mm,矩阵512 × 512,层厚和层间距均为5 mm,共32层。第2次为低剂量扫描,扫描参数如下:管电压100 kV,管电流为100~300 mA(自动管电流),光束准直64 × 0.625 mm,旋转时间0.5 s,螺距0.516,视野250 mm,矩阵512 × 512,层厚和层间距均为5 mm,共32层。根据两次CT扫描的辐射剂量报告,得到容积CT剂量指数(CTDIvol)和剂量长度乘积(DLP),并计算有效剂量(ED)。ED=DLP × 0.002 8 mSv·mGy-1 ·cm-1[4]

采用4组重建参数重建低剂量CT扫描数据,4组重建参数分别为30%强度ASIR-V(ASIR-V-30%),低强度DLIR (DLIR-L)、中等强度DLIR(DLIR-M)和高强度DLIR(DLIR-H)。所用重建均为Standard。重建层厚及间隔均为1.25 mm。

3. 图像分析:所有图像导入GE后处理工作站(Advantage Workstation 4.7, GE Healthcare, Milwaukee, 美国)进行客观定量测量和主观定性评估。

(1) 客观测量:由3名分别具有29、21和16年工作经验的神经放射诊断医师对CT横断面图像进行感兴趣区域(ROI)勾画,取3名医生测量的平均值作为最后的测量值。将大小为5 mm2的ROI置于4个区域,分别为:半卵圆中心水平额叶的白质,即表浅白质;大脑皮层的灰质,即表浅灰质;内囊后肢的白质,即深部白质;丘脑,即深部灰质。选取上述区域进行测量是因为上述区域相对没有伪影,干扰因素较少[5]。为确保不同区域ROI大小一致,ROI勾画采用复制和粘贴方法。测量CT值和图像噪声,图像噪声定义为记录ROI面积内图像像素CT值的标准差(SD)[5],该数值越小代表图像噪声小,图像质量越好。计算信号噪声比(SNR)和对比噪声比(CNR)。SNR=CT值ROI/SDROI,CNR 灰白质=(CT值灰质-CT值白质)/ CT值白质

(2) 主观评价:由3名分别具有29年、21年和16年工作经验的神经放射诊断医师在工作站分别独立阅片。图像以随机顺序呈现,扫描及重建参数不可见。评分均采用Likert 5分制,评估内容包括图像解剖结构和图像细节清晰程度。评分标准为:1分,图像质量差,解剖结构显示不清,无法诊断;2分,图像质量较差,解剖结构辨识困难,诊断价值有限;3分,图像质量一般,解剖结构部分欠清晰,初步满足诊断要求;4分,图像质量良好,解剖结构较清晰,满足诊断要求;5分,图像质量优,解剖结构清晰,诊断优异。分别由2名医师独立进行评价,结果不一致时由第3名医师仲裁。

4. 统计学处理:所有统计分析均使用SPSS 26.0软件包。采用单因素方差分析(ANOVA),比较组间的客观图像质量CT值、图像噪声、CNR和SNR,两两比较采用Bonferroni检验。采用Kruskal-Wallis检验比较主观图像质量评分,两两比较采用Mann-Whitney U检验。采用配对t检验比较常规剂量组及低剂量组的辐射剂量。放射诊断医师评分结果采用线性加权Kappa检验,Kappa≤0.2为一致性差,0.2 < Kappa ≤0.4为一致性低,0.4 < Kappa ≤0.6为一致性中等,0.6 < Kappa ≤0.8为一致性好,0.8 <Kappa ≤1为一致性高。P < 0.05为差异有统计学意义。

结果

1. 人员结构分析及辐射剂量:共纳入109例患者,男104例、女5例,年龄65~110岁(89.16±9.53岁)。低剂量组的CTDIvol、DLP、ED分别为(33.49±3.41)mGy、(447.74±5.55)mGy·cm、(0.93±0.01)mSv,常规剂量组的CTDIvol、DLP、ED分别为(65.26±0.02)mGy、(1 044.23±0.22)mGy·cm、(2.92±0.01)mSv,低剂量组较常规剂量组DLP和ED分别下降了57.12%和68.08%。

2. 客观图像质量分析:4组重建图像在图像噪声深部灰质、SNR深部灰质、图像噪声深部白质、SNR深部白质及CNR深部灰白质的总体差异有统计学意义(F =167.43、98.23、275.46、72.95、241.13,P < 0.05),见表 1。DLIR-M与DLIR-H组间图像噪声深部灰质、图像噪声深部白质和CNR深部灰白质的差异有统计学意义(t = 25.13、23.77、17.15,P < 0.001)。深部灰质和深部白质CT值,4组间差异没有统计学意义。随着DLIR的重建强度从低到高,深部灰质的图像降噪率分别从23.0%提高到51.0%,深部白质的图像降噪率分别从24.3%提高到53.3%。低剂量组DLIR-H的图像质量明显高于其他组,表明在降低剂量的情况下,通过DLIR重建仍然能够得到更清晰的图像。

表 1 109例患者4种不同CT重建算法的脑深部灰白质图像质量客观评价比较(x±s) Table 1 Objective evaluation and comparison of the quality of deep gray and white matter images in 109 patients using four different CT reconstruction algorithms (x±s)

4组重建图像在图像噪声表浅灰质、SNR表浅灰质、图像噪声表浅白质、SNR表浅白质以及CNR表浅灰白质的总体差异有统计学意义(F = 182.32、68.43、361.54、58.24、289.91,P < 0.05),表浅灰质和表浅白质CT值,组间对比差异没有统计学意义,见表 2。DLIR-M与DLIR-H组间图像噪声表浅灰质、图像噪声表浅白质和CNR表浅灰白质的差异有统计学意义(t = 28.74、16.43、15.23,P < 0.05)。随着DLIR的重建强度从低到高,表浅灰质的图像降噪率从12.8%提高到51.0%,表浅白质的图像降噪率从19.9%提高到49.7%。低剂量组DLIR-H的图像质量明显高于其他组,这个结果和前面在深部结构测量的结果一致。

表 2 109例患者4种不同CT重建算法的脑表浅部灰白质图像质量客观评价比较(x±s) Table 2 Objective evaluation and comparison of the quality of superficial gray and white matter images in 109 patients using four different CT reconstruction algorithms(x±s)

3. 主观图像质量分析:低剂量颅脑CT的ASIR-V-30%、DLIR-L、DLIR-M和DLIR-H重建图像总体图像质量主观评分差异有统计学意义(F = 6.81,P<0.05),两两比较显示DLIR-H组图像质量主观评分优于其他3组(t = 7.25、8.32、9.63,P<0.05)。图像质量主观评分在观察者间一致性高(Kappa =0.826,P<0.05)。

讨论

本研究在颅脑低剂量CT扫描中分别应用ASIR-V和DLIR两种重建算法,通过客观和主观评价比较不同重建算法的图像质量。结果显示,与ASIR-V相比,DLIR算法能够有效降低颅脑低剂量CT的图像噪声和伪影,并提高SNR和CNR。并且,随着DLIR,即TrueFidelity使用强度提高,对图像噪声和伪影的抑制能力逐渐增强,DLIR-H的主观和客观图像质量评价更优。

噪声是评估CT图像质量的主要指标,而图像质量对于检测腔隙性脑梗死这类小病变尤为重要。低噪声、高SNR有利于病变的检测。DLIR是近年来随着人工智能的兴起而产生的一种新技术,它能够同时实现高质量图像、低辐射剂量和快速重建速度的效果。DLIR算法采用类似的训练方法,即为训练网络提供数百万对匹配的图像,其中一组是低剂量低图像质量的图像,另一组是高剂量和超高图像质量的图像。系统进行深度学习并进行数以百万计的迭代和调整,在监督下自动学习如何消除低图像质量的噪声,转换为高质量的图像,转换过程中智能地消除了图像噪声数据,输出的图像是与真实图像完全匹配的[6]。本研究显示,与ASIR-V图像相比,DLIR图像在噪声、SNR、CNR及主观评分方面表现更优。研究结果与Kim等[5]的研究发现一致,即在颅脑CT成像中,DLIR算法通过降低图像噪声及伪影,较ASIR-V算法图像质量有明显提高;但也存在差异,Kim等[5]的研究比较的是常规辐射剂量扫描条件下不同重建算法的图像质量,其扫描的管电压为120 kV,平均DLP为(768.36±86.61)mGy·cm。而本研究比较的是低剂量条件下[管电压100 kV,平均DLP为(447.74±5.55)mGy·cm] 不同重建算法的图像质量,发现低剂量扫描联合DLIR同样可以明显提高图像质量。本研究结果扩展了DLIR的临床可适用范围,为今后开展颅脑低辐射剂量CT联合DLIR相关临床研究奠定了基础。此外,本研究中图像质量主观评分的观察者间一致性较Kim等[5]的研究高(Kappa系数0.826 vs. 0.717),这种差异可能源于本研究招募的3位图像观察者在神经放射诊断方面具有更丰富的临床经验,而Kim等[5]的研究中,仅有两位神经放射学家进行定性图像质量分析,因此本研究的图像判读结果更稳健、准确。

Alagic等[7]的研究发现对于创伤患者,DLIR相比ASiR-V具有更优异的图像质量,使TrueFidelity适用于创伤患者,并有可能改善对颅内出血的诊断表现。Sun等[6]在儿童群体中进行研究,发现与ASIR-V图像相比,DLIR-H提高了儿童头部CT图像的质量,0.625 mm层厚DLIR-H图像改善了病变检测,并得到与5 mm层厚50%ASIR-V图像类似的图像噪声,预示如果使用与ASIR-V相同图像质量和层厚,DLIR-H可以减少85%的剂量。有研究纳入的人群是怀疑腔隙性脑梗死的老年群体,对于此群体而言,DLIR-H图像较ASIR-V图像具有更好的图像质量,与此前多项研究相符[5-6, 8]。脑内腔隙性梗死灶的清晰显示具有重要的临床意义,因为随着老年人年龄增长自发性脑出血的概率增加,通过CT筛查发现腔隙性梗死灶,将为临床医师制定进一步评估方案和个体化治疗提供依据[9]。本研究结果为DLIR应用于临床奠定了基础,使进行CT检查的可疑腔隙性梗死患者受益,避免了以往ASIR算法图像上因图像噪声引起的对腔隙性梗死灶模棱两可的诊断结果,是本研究的创新点。

本研究结果表明在提升图像质量的同时,低剂量颅脑CT采用不同强度的DLIR算法与采用ASIR-V算法相比,未改变深、浅部脑灰白质的CT值,表明DLIR未改变图像外观,这对于病变的定量检测十分重要。

本研究的局限性:首先,本研究为回顾性研究,样本量相对较少,需要扩大样本量进一步验证;其次,仅进行了较常规扫描下降57.12%辐射剂量条件下的评估,没有在不同的辐射剂量水平上对DLIR进行客观及主观图像分析,但该辐射剂量水平的设置是基于前期预实验的结果,在保证尽可能减低辐射剂量的同时不影响临床常规诊断需求;最后,由于本研究的重点是评估DLIR在低剂量条件下对图像质量的提升,未报告病灶的显示能力,病灶的检出率的提升情况有待于进一步验证。

综上所述,与ASIR-V相比,DLIR算法能够有效降低颅脑低剂量CT的图像噪声和伪影,并提高SNR和CNR。并且,随着DLIR使用强度提高,图像噪声和伪影的抑制能力逐渐增强,DLIR-H的主、客观图像质量评价最优。

利益冲突  无

作者贡献声明  崔津津负责采集数据、统计分析及论文撰写;刘贯中负责判读图像及处理数据;胡兴和负责材料收集;韩邵军负责材料收集;孙红负责判读图像;王新江负责论文审阅及指导;姚洪祥负责指导论文研究设计方案及论文修改,提供课题支持

参考文献
[1]
Mitani H, Tatsugami F, Higaki T, et al. Accuracy of thin-slice model-based iterative reconstruction designed for brain CT to diagnose acute ischemic stroke in the middle cerebral artery territory: a multicenter study[J]. Neuroradiology, 2021, 63(12): 2013-2021. DOI:10.1007/s00234-021-02745-4
[2]
Schofield, R, King L, Tayal U, et al. Image reconstruction: part 1 - understanding filtered back projection, noise and image acquisition[J]. J Cardiovasc Comput Tomogr, 2020, 14(3): 219-225. DOI:10.1016/j.jcct.2019.04.008
[3]
Geyer LL, Schoepf UJ, Meinel FG, et al. State of the art: iterative CT reconstruction techniques[J]. Radiology, 2015, 276(2): 339-357. DOI:10.1148/radiol.2015132766
[4]
Hidajat N, Mäurer J, Schröder RJ, et al. Relationships between physical dose quantities and patient dose in CT[J]. Br J Radiol, 1999, 72(858): 556-561. DOI:10.1259/bjr.72.858.10560337
[5]
K im, J H, Yoon HJ, Lee E, et al. Validation of deep-learning image reconstruction for low-dose chest computed tomography scan: emphasis on image quality and noise[J]. Korean J Radiol, 2021, 22(1): 131-138. DOI:10.3348/kjr.2020.0116
[6]
Sun J, Li H, Wang B, et al. Application of a deep learning image reconstruction (DLIR) algorithm in head CT imaging for children to improve image quality and lesion detection[J]. BMC Med Imaging, 2021, 21(1): 108. DOI:10.1186/s12880-021-00637-w
[7]
Alagic Z, Diaz Cardenas J, Halldorsson K, et al. Deep learning versus iterative image reconstruction algorithm for head CT in trauma[J]. Emerg Radiol, 2022, 29(2): 339-352. DOI:10.1007/s10140-021-02012-2
[8]
Shirasaka T, Kojima T, Funama Y, et al. Image quality improvement with deep learning-based reconstruction on abdominal ultrahigh-resolution CT: A phantom study[J]. J Appl Clin Med Phys, 2021, 22(7): 286-296. DOI:10.1002/acm2.13318
[9]
Gatti L, Tinelli F, Scelzo E, et al. Understanding the pathophysiology of cerebral amyloid angiopathy[J]. Int J Mol Sci, 2020, 21(10): 3435. DOI:10.3390/ijms21103435