基于生物信息学分析类风湿关节炎铜死亡相关基因及中药筛选预测

目的 利用生物信息学研究类风湿关节炎(Rheumatoid arthritis,RA)铜死亡相关分子模式和诊断性生物标志物,同时预测具有潜在治疗作用的中药。方法 从Tibiofemoral joint基因表达综合数据库中下载GSE55235、GSE55457、GSE77298表达谱Gefitinib-based PROTAC 3核磁数据作为训练数据集,提取铜死亡相关基因进行分析。选择RA患者和健康对照组之间差异表达的铜死亡相关基因(Differentially expressed cuproptosis-associated gene,DECAG),分析DECAG相关的免疫浸润、生物学功能。根据DECAG的表达量对RA患者进行共识聚类分型,基于分型进行加权基因共表达网络分析(Weighted gene co-expression network analysis,WGCNA)来识别核心基因。取degree值前100的核心基因做GO和KEGG富集分析并构建训练模型,训练模型包括随机森林模型(Random forest,RF)和支持向量机模型(Support vector machine,SVM)、eXtreme gradient boosting(XGB)模型和广义线性模型(Generalized linear model,GLM),筛选与RA特征最相关的5个基因作为诊断性生物标志物并进行验证。最后进行中药预测。结果 获得6个DECAG(NLRP3、SLC31A1、LIAS、Cselleck AMG510DKN2A、DBT、DLST)。使用共识聚类方法将RA基因分为两个亚型(C1,C2),分型WGCNA获得核心基因418个。取degree值前100的核心基因构建训练模型,基于对|残差|的反向累积分布图和|残差|的箱线图的分析,发现SVM模型与其他三种模型相比,SVM模型维持最低的|残差|分布。总体受试者工作特征曲线(Receiver operating characteristic curve,ROC)结果显示,SVM模型比其他三个模型具有更高的网络曲线下面积(Area under the curve,AUC)值(AUC:0.966)。综合考虑,SVM模型为最合适的训练模型。获得5个与RA特征最相关的基因(TMOD3、PIK3CG、WASL、FGF4、GSN),基于5个RA特征基因的表达水平,建立了临床应用列线图,并且决策曲线分析(Decision curve analysis,DCA)图和校正曲线图也显示结果具有良好的预测准确…