本發(fā)明是屬于預后模型的,特別是關于一種基于乳酸代謝相關基因的彌漫性大b細胞淋巴瘤風險預后模型。
背景技術:
1、彌漫性大b細胞淋巴瘤(dlbcl)作為最常見的非霍奇金淋巴瘤亞型,存在30-40%患者復發(fā)難治的臨床挑戰(zhàn)。現(xiàn)有國際預后指數(shù)(ipi)因腫瘤異質(zhì)性預測效果有限,需要進一步研究來優(yōu)化具有新型生物標志物的分層模型,以指導不良結(jié)局。
2、有氧糖酵解作為癌細胞的中心代謝標志,能夠生成重要的代謝燃料乳酸。細胞外的乳酸通過mct1轉(zhuǎn)運蛋白參與三羧酸循環(huán)產(chǎn)能,并在腫瘤微環(huán)境(tme)中形成酸濃度梯度,抑制cd8+t細胞等免疫活性,同時促進腫瘤生長。因此,針對乳酸及其相關代謝途徑的治療策略有望通過恢復免疫效能和降低腫瘤細胞的營養(yǎng)利用率來減緩腫瘤進展。然而,目前并沒有證據(jù)表明乳酸代謝相關的基因集與dlbcl預后存在相關性。
技術實現(xiàn)思路
1、本發(fā)明利用gse10846和gse87371數(shù)據(jù)集篩選乳酸代謝相關基因(lmrgs),構建并驗證預后風險模型,揭示其與臨床病理特征、免疫特征及治療應答的關聯(lián)。
2、為達到上述技術目的,本發(fā)明所采用的技術方案是:一種基于乳酸代謝相關基因的彌漫性大b細胞淋巴瘤風險預后模型,所述模型的建立方法,包括以下步驟:
3、s1:數(shù)據(jù)采集與處理:登錄geo數(shù)據(jù)庫的網(wǎng)站獲取gse10846和gse87371數(shù)據(jù)集中dlbcl患者的基因表達譜數(shù)據(jù)和臨床數(shù)據(jù),并對數(shù)據(jù)進行標準化處理;
4、s2:預后模型構建:基于獲取的數(shù)據(jù),進行單因素cox回歸分析,篩選與預后相關的lmrgs,進一步采用lasso-cox回歸構建包含5個乳酸代謝相關基因(lmrgs;hif-1a、myc、ndufb11、pitrm1、sdha)的風險預后模型;上述5個基因的核苷酸序列均可從網(wǎng)站中獲?。ɑ騣d:3091(hif-1a);4609(myc);54539(ndufb11);10531(pitrm1);6389(sdha));
5、s3:預后模型驗證與評估:通過訓練組(gse10846;內(nèi)部驗證)和驗證組(gse87371;外部驗證)評估模型的預測效能,利用kaplan-meier曲線、時間依賴性roc曲線及列線圖驗證模型效能的準確性;
6、s4:預后的模型應用:通過整合cibersort、ssgsea和estimate分析結(jié)果揭示預后模型的免疫特征,藥物敏感性及tide分析揭示預后模型的治療反應相關性。
7、進一步的,s1的具體步驟包括:(1)從geo中獲取彌漫性大b細胞淋巴瘤(dlbcl)患者的基因表達譜及臨床數(shù)據(jù)(gse10846和gse87371);(2)剔除臨床生存信息缺失或未知的樣本后,gse10846的412例dlbcl患者被設為訓練組,gse87371的221例患者作為驗證組。
8、進一步的,s2的具體步驟包括:(1)通過文獻檢索和分子特征數(shù)據(jù)庫(msigdb,https://www.gsea-msigdb.org/gsea/msigdb),最終整合309個lmrgs。(2)通過單因素cox回歸分析初步篩選得到98個預后相關lmrgs(閾值p<0.05)。(3)lasso-cox分析進一步篩選到5個關鍵預后lmrgs(hif-1a、myc、ndufb11、pitrm1、sdha)。(4)分別將5個lmrgs的rna表達量乘以多因素cox回歸系數(shù)構建風險評分公式(危險評分?=?(-0.6362086)?×?hif-1a?+0.3394503?×?myc+?(-0.3490697)?×?ndufb11+?(-0.5430206)?×?pitrm1+?0.6505132×?sdha)。根據(jù)訓練組中位風險評分將患者分為高風險組和低風險組,驗證組采用相同閾值。
9、進一步的,s3的具體步驟包括:(1)kaplan-meier曲線和log-rank檢驗比較高低風險組間生存差異;(2)時間依賴性roc曲線(timeroc?r包)計算曲線下面積(auc)以評估預后模型效能;(3)在訓練集中,整合年齡、性別、美國東部腫瘤協(xié)作組體能狀態(tài)(ecog?ps)評分、ann?arbor分期、ipi評分、結(jié)外受累淋巴結(jié)數(shù)及預后風險評分等8個變量,構建1年、3年和5年生存率預測列線圖,通過校準曲線比較預測生存率與實際生存率以評估模型準確性。
10、進一步的,s4的具體步驟包括:(1)采用cibersort算法評估22種免疫細胞浸潤水平,ssgsea量化28種免疫細胞豐度,estimate方法計算腫瘤純度、基質(zhì)/免疫細胞含量及免疫微環(huán)境評分;(2)利用oncopredict?r包預測dlbcl患者的臨床藥物反應,以gdsc?v2數(shù)據(jù)集(含基因表達矩陣及ic50數(shù)據(jù),下載自https://osf.io/c6tfx/)為訓練集,gse10846為測試集,通過calcphenotype函數(shù)預測藥物敏感性(ic50),tide算法評估免疫治療潛在反應。
11、本發(fā)明的有益效果在于:本發(fā)明基于gse10846和gse87371數(shù)據(jù)集篩選乳酸代謝相關基因(lmrgs)構建的預后風險模型,不僅能夠與患者的臨床病理特征顯著相關,且展現(xiàn)出優(yōu)異的預后預測效能。同時,該模型通過風險評分系統(tǒng)可間接反映患者腫瘤免疫微環(huán)境的異質(zhì)性特征,并有效預測其對特定化療藥物的治療反應,從而為制定個體化治療策略提供科學依據(jù)。
1.一種基于乳酸代謝相關基因的彌漫性大b細胞淋巴瘤風險預后模型,其特征在于:所述模型的建立方法包括以下步驟:
2.如權利要求1所述的一種基于乳酸代謝相關基因的彌漫性大b細胞淋巴瘤風險預后模型,其特征在于:
3.如權利要求1所述的一種基于乳酸代謝相關基因的彌漫性大b細胞淋巴瘤風險預后模型,其特征在于:s2的具體步驟包括:(1)通過文獻檢索和分子特征數(shù)據(jù)庫(msigdb,https://www.gsea-msigdb.org/gsea/msigdb),最終整合309個lmrgs;(2)通過單因素cox回歸分析初步篩選得到98個預后相關lmrgs(閾值p<0.05);(3)lasso-cox分析進一步篩選到5個關鍵預后lmrgs(hif-1a、myc、ndufb11、pitrm1、sdha);(4)分別將5個lmrgs的rna表達量乘以多因素cox回歸系數(shù)構建風險評分公式(危險評分?=?(-0.6362086)?×?hif-1a?+0.3394503?×?myc+?(-0.3490697)?×?ndufb11+?(-0.5430206)?×?pitrm1+?0.6505132×?sdha),根據(jù)訓練組中位風險評分將患者分為高風險組和低風險組,驗證組采用相同閾值。
4.如權利要求1所述的一種基于乳酸代謝相關基因的彌漫性大b細胞淋巴瘤風險預后模型,其特征在于:s3的具體步驟包括:(1)kaplan-meier曲線和log-rank檢驗比較高低風險組間生存差異;(2)時間依賴性roc曲線(timeroc?r包)計算曲線下面積(auc)以評估預后模型效能;(3)在訓練集中,整合年齡、性別、美國東部腫瘤協(xié)作組體能狀態(tài)(ecog?ps)評分、ann?arbor分期、ipi評分、結(jié)外受累淋巴結(jié)數(shù)及預后風險評分等8個變量,構建1年、3年和5年生存率預測列線圖,通過校準曲線比較預測生存率與實際生存率以評估模型準確性。
5.如權利要求1所述的一種基于乳酸代謝相關基因的彌漫性大b細胞淋巴瘤風險預后模型,其特征在于:所述s4的具體步驟包括:(1)采用cibersort算法評估22種免疫細胞浸潤水平,ssgsea量化28種免疫細胞豐度,estimate方法計算腫瘤純度、基質(zhì)/免疫細胞含量及免疫微環(huán)境評分;(2)利用oncopredict?r包預測dlbcl患者的臨床藥物反應,以gdsc?v2數(shù)據(jù)集(含基因表達矩陣及ic50數(shù)據(jù),下載自https://osf.io/c6tfx/)為訓練集,gse10846為測試集,通過calcphenotype函數(shù)預測藥物敏感性(ic50),tide算法評估免疫治療潛在反應。