基金项目: 国家重点研发计划项目(编号:2020 YFE0202200)~~
作者:冯祎婷;任亮亮;娄丽娟;沈玉先;姜颖;
关键词:丙烯醛; 肺癌; 环境污染物; 生物信息学; 机器学习; 预后模型;
DOI:10.19405/j.cnki.issn1000-1492.2025.11.001
〔摘 要〕 目的 通过生物信息学方法构建并验证基于丙烯醛相关基因的肺癌预后预测模型。方法 利用 GEO 数据库获取肺癌数据集 GSE30219 和 GSE68465 , 同时从 CTD 数据库筛选丙烯醛相关基因集。首先,在 GSE30219 数据集中筛选癌与癌旁的差异表达基因(DEGs) , 与丙烯醛基因集取交集,获得候选基因。随后,采用基因集变异分析( GSVA) 以评估其功能变化特征。基于 STRING 数据库构建蛋白质互作(PPI)网络,筛选核心枢纽基因(Hub Genes) 。采用 SVM-RFE 和 LASSO-Cox 回归分析构建基于丙烯醛相关基因的肺癌预后预测模型,并使用 GSE68465 数据集进行独立验证。通过 CIBERSORT 方法分析高低风险组的免疫细胞浸润特征,同时对高低风险组的 DEGs 进行功能富集分析,进一步揭示基于丙烯醛相关基因的肺癌预后的潜在分子机制。结果 共筛选出 361 个丙烯醛相关的肺癌 DEGs , 进一步确定 7 个关键基因用于模型构建。Kaplan-Meier 生存分析显示,高风险组患者的生存率显著低于低风险组(P < 0. 000 1) 。ROC 曲线分析结果表明,该模型具有良好的预测性能。此外,免疫浸润分析显示,风险评分与多种免疫细胞亚群密切相关,揭示了丙烯醛相关基因在肺癌免疫微环境中的潜在作用。结论 基于丙烯醛相关基因的肺癌预后模型在肺癌的预后中展现出显著的应用价值,为揭示丙烯醛在肺癌发生与发展的潜在机制提供新的依据。