胰导管腺癌(PDAC)启动和进展相关通路和基因的生物信息学分析

目的:从 NCBI GEO(Gene Expression Omnibus)中选择三个胰腺导管腺癌(Pancreatic ductal adenocarcinoma,PDAC)数据集用于筛选潜在的PDAC预后生物标志物。基因富集分析以发现差异表达基因涉及的信号通路和基因本体功能。该研究旨在使用微阵列数据集鉴定参与PDAC发生发展的主要调节基因。方法:从GEO数据库获得胰腺导管腺癌及相应健康胰腺导Polymerase Chain Reaction管组织的基因表达谱(GSE46234、GSE62165、GSE62452)。GSE46234 的微阵列数据基于 GPL570[HG-U133_Plus_2]Affymetrix Human Genome U133 Plus 2.0 Array;GSE62165 基于GPL13667[HG-U219]Affymetrix Human Genome U219 Array,GSE62452 基于GPL6244[HuGene-1_0-st]Affymetrix Human Gene 1.0 st Array[转录本(基因)版本]收集。我们从GSE46234(胰腺肿瘤组织:4例;正常胰腺组织:4例)、GSE62165(胰腺肿瘤组织:118例;正常胰腺组织:13例)和GSE62452(胰腺肿瘤组织:69例;正常胰腺组织:61例)中收集所有样本,使用GEO2R筛选PDAC中肿瘤组织和正常组织样品之间的差异表达基因(Differentially expressed genes)。将P<0.05和Z-score归一化的log fold change(logFC>0作为统计学上显著基因的标准。使用在线工具创建维恩图(图 2)(https://bioinformatics.psb.ugent.be/webtools/Venn/).由于所有微阵列数据集都来源不同平台,因此我们使用Z-score方法对logFC值进行归一化:Z score=(x-μ)/σ;其中 x=logFC,μ=平均值(logFC),σ=标准差(logFC)。从DAVID(版本6.8)检索DEG的基因本体论(GO)和京都基因和基因组百科全书(KEGG)通路信息[1,2].我们通过STRING(版本11.0)[3](一种分析两种或多种蛋白质之间的功能网络)创建差异表达的基因之间的蛋白质-蛋白质相互作用(Protein-protein interaction;PPI)。随后运用 Cytoscape(v 3.9.0)软件对 PPI 可视化为整体集群[4].并且通过MCODE分子复合物检测插件(MCODE)(版本1.5.1)对整个网络进行进一步分析,从而获得中枢基因列表.MCODE的配置如下:degree cutoff-2,node score cutoff-0.2,K-Core-2,maximum depth-100。筛选显著中枢基因的标准:上调DEG的总体MCODE得分为12.769,下调DEG的总体MCODE得分为12.00。选用UALCAN的PAAD肿瘤数据库中4例正常组织样本和178例肿瘤组织样本,验证所选中枢基因在UALCAN中的基因表达和生存分析。人类蛋白质图谱(human protein atlas;HPA)用于进一步验证数据分析后所获得作为预后Hub基因。结果:三个数据集共识别出共有133个上调的差异表达基因(表2;图2RP56976细胞培养A)(P<0.05,logFC>0)和256个下调的基因(表3;图2B)(P<0.05,logFC<0)。在差异表达的上调中枢基因中具有显着性(P<0.05)的主要KEGG途径是细胞外基质(ECM)受体相互作用通路,细胞局灶性粘附过程,肺小细胞癌,唾液分泌物,阿米巴病。显著上调基因GO分析(P<0.05)主要富集在细胞分裂,基于微管的运动,逆行囊泡介导的运输;Golgi基到ER,抗原处理和通过MHC Ⅱ类呈递外源肽抗原,有丝分裂染色体向纺锤体极点移动,有丝分裂纺锤体组织,有丝分裂的细胞周期,有丝分裂中期/后期转化的调控,动粒组装,泛素化依赖的蛋白质分解代谢过程,有丝分裂纺锤体装配,有丝分裂细胞周期的调控,有丝分裂胞质分裂,染色体分离,微管,有丝分裂纺锤体,纺锤体,细胞核,纺锤极,中间体,细胞液,纺锤中间区,及核浆,驱动蛋白复合体,分裂沟,细胞间桥,微管结合,蛋白激酶结合,微管运动活性,ATP结合,蛋白质结合,ATP依赖的微管运动活性,加上末端导向,ATP依赖的微管运动活性。通过Cytoscape的MCODE插件识别出14个上调的差异表达中枢基因是CENPE,CKS2,PTTG1,CKAP2L,UBE2C,TPX2,RACGAP1,KIF20A,DLGAP5,KIF11,MELK,TK1,LMNB1 和UHRF1。通过UALCAN平台分析发现14个差异表达的上调中枢基因在PDAC肿瘤细胞中均过表达。并且均与PDAC生存期呈负相关,预后不良。通过HPA数据库进一步验证14个差异表达的中枢基因揭示了 14个基因中的9个是与预后相关,而其他5个基因与PDAC/胰腺癌预后无关。结论:微阵列是用于研究复杂疾病机制的强大工具,可以详细研究同时参与病理过程的多个基因之间的关系。并且在生物标志物检测方面见解独到。本研究旨在探索PDAC潜在的中枢基因和具有预后价值的途径。通过体内外研究分析来构建差异表达的基因(DEG)及其途径,并提供相关见解。PDAC的9个预后基因是CKS2,UBE2C,TPX2,RACGAP1,KIF20A,DLGAP5,KIF11,MELK 和 UHRFI,而 5 个非预后基因是CENPE,PTTG1,CKAP2L,TK1和LMNB1。重要的KEGG途径是细胞外基质(ECM)受体相互作用通路,细胞局灶性粘附过程,唾液分泌物。微管活动与其他细胞过程的相互作用,如细胞分裂,有丝分裂,ATErdafitinib溶解度P结合和蛋白质结合是涉及胰腺癌进展的相关GO术语。鉴于PDAC的生物标志物状态,有必要广泛寻找更可靠的生物标志物用于其早期检测,同时寻找可用于其治疗的靶向途径。