胰腺癌目前是世界肿瘤死亡的第七大因素,发病率逐渐增加,病人的预后极差。要改善患者的生存结果,关键在于按照不一样的预后标准确定个性化的治疗对策。本文基于胰腺癌患者的遗传学及临床数据,通过机器学习方法建立预后模型,确定与胰腺癌发生发展相关的关键基因以及预后标志物,丰富了提高病人治疗效果、改善预后的理论依据。本文的主要研究内容如下:1.基于支持向量回归以及递归特征消除方法的患者整体生存期预测模型的研究。本文采用支持向量回归和递归特征消除的混合算法构建了胰第一个定量预测腺癌患者总体生存(OS)的模型,确定了与OS相关的70种RNA,包括33种m RNA,28种lnc RNA和9种mi RNA。10倍交叉验证(R~2为0.9693)和泛化能Biofertilizer-like organism力(R~2为0.9666)的结果显示,该模型具有可靠的预测性能,这70种RNA是影响胰腺癌患者OS的重要因素。为了进一步研究RNA-RNA相互作用与生存的关系,构建了ce RNA调控网络。ce RNA网络中各节点的度中心性、介数中心性和接近性中心性显示,hsa-mir-570、hsa-mir-944、hsa-mir-6506、hsa-mir-3136、MMP16、PLGLB2、HPGD、FUT1、MFSD2A、SULT1E1、SLC13A5、ZNF488、F2RL2、TNFRSF8、TNFSF11、FHDC1、ISLR2和THSD7B是枢纽节点,它们是与胰腺癌患者OS联系紧密的关键RNA。2.基于深度学习和Cox模型的胰腺癌患者预后模型的构建。提出了一个深度神经网络模型对胰腺癌病人的死亡风险进行预测,模型不仅考虑了协变量间的非线性关系,解决了传统Cox模型仅仅考虑变量线性关系的问题,同时也将基因共表达关系、生物通路间的线性关系与非线性关系纳入考虑范畴,取得了比Deep Surv等已有模型更好的预测效果,C-index从0.7869提升到了0.8023。富集分析表明,61个共表达基因在包括细胞外空间、免疫反应调节、消化、皮肤发育、脂质消化、脂肪酶活性、B细胞激活、MS-275细胞表面在内的27个生物过程以及包括胰腺分泌、原发性免疫缺陷、甘油脂代谢、阿米巴病、代谢通路等在内的30条生物通路中显著富集。进一步的研究表明,这些生物过程和通路在胰腺癌的发生与发展进程中扮演着重要角色,对共表达基因以及其点击此处富集结果的进一步分析将有助于改善胰腺癌患者的预后。3.基于蛋白质相互作用网络的胰腺癌预后关键分子的确定。通过单变量Cox分析,从3699个差异表达基因中筛选出425个与胰腺癌患者预后相关的基因,之后构建了其对应的蛋白质相互作用网络,基于复杂网络理论,识别出KIF20A、BUB1、CEP55、ASPM、CDK1、TOP2A、CENPF、TPX2、PBK、KIF2C、CCNA2、CCNB2、NUSAP1、CDC20、TTK、BUB1B、KIF11、KIF23、NCAPG以及DLGAP5等20个网络中的关键节点,这些基因是与胰腺癌预后相关的关键分子。通过多变量Cox回归分析,构建了预后风险模型。根据风险值的大小将患者分为两组,生存分析的结果表明,二者整体生存期有显著差异。风险评分可以作为胰腺癌患者独立的预后因素。本文通过机器学习方法构建了胰腺癌患者的预后模型,模型中的特征分子可以为胰腺癌的个性化治疗方法提供参考,为患者的精准化治疗提供思路。