基於 GEO 和 TCGA 資料庫的肝癌早期診斷生物標誌物和預後生物標誌物鑑定的計算分析以及影響肝癌生存時間的通路和生物功能研究
菜鳥小白1212 生信豆芽菜
Computational analysis for identification of early diagnostic biomarkers and prognostic biomarkers of liver cancer based on GEO and TCGA databases and studies on pathways and biological functions affecting the survival time of liver cancer---基於 GEO 和 TCGA 資料庫的肝癌早期診斷生物標誌物和預後生物標誌物鑑定的計算分析以及影響肝癌生存時間的通路和生物功能研究
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC8268589/pdf/12885_2021_Article_8520.pdf
一、資料
GSE25097+TCGA
二、資料分析
1、TCGA和GEO分別進行差異分析,並透過重疊分析篩選關鍵的共有的基因
2、差異基因的GO和Reactome通路分析
使用 clusterProfiler 和ReactomePA包進行分析
3、透過PPI篩選關鍵的hub基因,使用 102 個 DEG 作為 STRING 的輸入來構建 PPI 網路。PPI 網路圖被匯出到 Cytoscape 。CytoHubba 應用程式外掛用於計算度值和其他引數值。以Degree Values > = 5的基因為Hub Genes,共獲得22個Hub Genes。
4、Hub基因在肝癌患者中的表達
5、Hub基因的ROC曲線分析
使用包 pROC 對 22 個 Hub 基因進行 ROC 曲線分析。以 AUC > 90% 作為截斷值,發現 AUC > 90% 的 22 個 Hub 基因中有 16 個包括 SPP1、AURKA、CXCL12、FOS、NUSAP1、TOP2A、UBE2C、AFP、DCN、GMNN、PTTG1、分別為 RRM2、SOCS3、FOSB、PCK1 和 SPARCL1。這些基因的表達水平在區分正常組織和肝癌組織方面具有很高的準確性,可能成為潛在的“腫瘤生物標誌物”。同時可作為肝癌診斷的生物標誌物,對肝癌的準確診斷具有重要意義。
6、Hub 基因的生存曲線
根據 Kaplan-Meier 估計繪製生存曲線。Cox迴歸模型用於計算肝癌患者樞紐基因的風險比(HR)。結果表明,在這些Hub基因中,ESR1、SPP1和FOSB基因的表達水平與肝癌患者的生存時間密切相關,差異有統計學意義(p < 0.05)。HR 值分別為 0.88、1.1 和 0.88,這可以翻譯為 ESR1 和 FOSB 代表低風險因素,而 SPP1 是高風險因素。
7、GSEA揭示了影響肝癌生存時間的生物學功能
單基因GSEA用於研究與存活時間相關的生物學途徑和生物學功能。ESR1、FOSB和SSP1基因的高低表達透過ssGSEA的方法分析啟用和抑制的關鍵通路。
三、總結
本文研究的重要,從差異基因的廣篩到共有基因的篩選,都屬於常規操作,接著透過PPI(網路分析)從共有基因中篩選hub基因,再透過ROC曲線篩選auc>0.9的關鍵基因,這些基因可以認為與預後相關同時又是與肝癌發生顯著相關。最後作者透過ssGSEA的方法,分析這些基因的調控的關鍵通路。