超声影像组学预测甲状腺微小乳头状癌中央区淋巴结转移的研究

目的:根据可能预测颈部中央区淋巴结转移(central lymph node metastasis,CLNM)的超声(ultraLY2835219体外sound,US)影像组学特征和临床风险因素建立一个用于术前预测甲状腺微小乳头状癌(papillary thyroid microcarcinom,PTMC)的CLNM的梯度提升决策树(Gradient Boosting Decision Tree,GBDT)模型,并进一步评估其性能。方法:对吉林大学中日联医院甲状腺外科2020年1月至2022年7月收治的共274名PTMC患者进行了回顾性分析。患者按照8:2的比例被随机分为训练队列和验证队列。开源软件(ITK-SNAP,3.8.0,www.itksnap.org)中输入PTMC病灶的超声图像,在超声图像中手动绘制病灶的感兴趣区域(region of interest,ROI),使用开源软件Pyradiomics提取其中的影像组学特征,删除数值缺失的影像组学特征,余特征中的异常数据使用中值进行填充,然后通过最大最小归一化方法对原始数据进行预处理。WEKA软件用于选择CLNM相关的影像组学特征。通过统计学方法筛选出与CLNM相关的临床危险因素。结合影像组学特征、临床危险因素,通过scikit-learn Python库(1.0.2版)建立GBDT模型,并与超声报告的颈部淋巴结状态的诊断效能进行对比。通过mode FRONTIER软件对训练和验证队列的GBDT模型进行约束,避免其发生过拟合。绘制受试者工作曲线(receiver operating characteristic curve,ROC),并计算曲线下面积(area under curve,AUC),用于模型诊断性能的评估。应用SHapley Additive ex Planations(SHAP)实现GBDT模Epigenetics抑制剂型全局和局部的可视化分析,SHAP算法由SHAP Python框架(0.41.0版)执行实现。通过绘制检测误差权衡(Detection error tradeoff,DET)曲线,更准确地评估模型的判断性能,并使用决策曲线来衡量不同阈值概率下的净收益,以评估模型的临床实用性。结果:在训练队列中,从每张原始超声图像中提取了1034个特征。删除了52个无效特征,保留了982个有效特征。经WEKA软件筛选后,7个影像组学特征与中央区淋巴结状态显著相关。经过学生t检验、卡方检验后,发现临床因素中性别(31.5%vs.12.0%,P<0.001)、年龄(41.88±9.66 vs.46.94±8.12,P<0.001)与CLInvasive bacterial infectionNM显著相关,联合影像组学特征、性别、年龄、体重指数(body mass index,BMI)构建GBDT模型。GBDT模型在训练队列和验证队列中的AUC值分别为0.946(95%CI,0.920-0.972)和0.845(95%CI,0.714-0.976),而单独的超声报告的淋巴结状态的AUC值分别为0.583(95%CI,0.508-0.659)和0.582(95%CI,0.430-0.736)。Delong检验显示两者有显著性差异(0.946 vs.0.583,P<0.001),验证队列显示类似的结果(0.845 vs.0.582,P<0.001)。DET曲线显示两个队列的曲线都集中在第三象限,说明其错误拒绝率和错误接受率都在较低水平,GBDT模型的判别效能较好。SHAP图提示性别、影像组学特征、46-55年龄段、26-35年龄段是模型的关键特征。决策曲线分析当阈值概率在0.1至1.0之间时,与全接受治疗或全不治疗相比,用GBDT模型预测PTMC患者的CLNM可使患者受益更多。结论:1.基于超声影像组学和临床风险因素的GBDT模型可以预测PTMC患者的CLNM,指导患者治疗的临床决策。2.基于超声影像组学和临床风险因素的GBDT模型在预测PTMC的CLNM方面优于传统超声。3.根据临床特征分析,青年男性PTMC患者更容易发生CLNM。