目的 使用生物信息学方法分析耐吉非替尼非小细胞肺癌(NSCLC)细胞的差异表达基因。方法 使用GEO数据库下载GSE122005数据集,包括3份吉非替尼敏感细胞样本(Gefitinib1、Gefitinib2、Gefitinib3)和3份获得性吉非替尼耐药细胞样本(Acquired1、Acquired2、Acquired3)。对数据质量进行检测后,使用R语言筛选差异表达基因。利用在线工具DAVID 6.7和KOBAS 3.0对差异表达基因进行富集分析和通路分析。使用STRING 11.0构建蛋白质互相作用(PPI)网络,通过CytoScape 3.7.1筛选关键基因。针对不同关键基因表达水平的NSCLC患者,利用在线工具Kaplan-Meier Plotter 进行生存分析。结果 共筛选出604个差异表达基因,包括上调基因332个,下调基因272个。差异表达基因主要涉及9种分子功能(包括生长因子结合、糖蛋白结合等)、17种细胞组成(包括核小体、细胞外空隙、细胞外区域部分、质膜部分等)、72种生物过程(包括核小体装配、创伤反应等),参与癌症中的转录失调、肿瘤坏死因子信号通路等。PPI网络筛选出10个关键基因(CXCL8、ERBB2、TIMP1、SPP1、CXCL1、CDH2、CCL2、EDN1、CSF2、CCL20);CXCL8、SPP1、TIMP1高表达和EDN1低表达的NSCLC患者生存期较短(均P<0.05)。结论 CXCL8、SPP1、TIMP1、EDN1可能在NSCLC对吉非替尼耐药的机制中起重要作用,但具体的作用机制有待进一步研究。