打開網(wǎng)易新聞 查看精彩圖片

2025年4月15日,華中科技大學同濟醫(yī)學院公共衛(wèi)生學院郝興杰課題組Cell Genomics發(fā)表了題為Incorporating multiple functional annotations to improve polygenic risk prediction accuracy的研究論文,該研究提出一種名為OmniPRS的多基因遺傳風險評分(Polygenic Risk Score, PRS)方法。OmniPRS通過整合全基因組關(guān)聯(lián)研究(GWAS)的匯總數(shù)據(jù)和多組學數(shù)據(jù),顯著提高了復(fù)雜疾病遺傳風險的預(yù)測準確性,同時大幅降低了計算成本,為大規(guī)?;蚪M研究和臨床應(yīng)用提供了高效工具。

打開網(wǎng)易新聞 查看精彩圖片

多基因遺傳風險評分(PRS)是評估個體疾病遺傳風險的重要方法,但其準確性受限于遺傳結(jié)構(gòu)的復(fù)雜性和現(xiàn)有方法對功能注釋信息的利用不足。傳統(tǒng)PRS方法通常忽略遺傳變異,即單核苷酸多態(tài)性(SNP)的生物學功能或組織特異性調(diào)控機制,導(dǎo)致預(yù)測效能受限。OmniPRS方法基于“多基因模型”(polygenic model)理論的一種特殊框架——“全基因模型”(omnigenic model),通過分層連鎖不平衡評分回歸(S-LDSC)量化不同組織特異性功能注釋的遺傳方差成分,并利用混合模型重新估計SNP效應(yīng)值,實現(xiàn)“全基因模型”核心基因(core gene)和周圍基因(peripheral gene)的假設(shè);進一步提出三種整合策略(等權(quán)重模型、貝葉斯模型平均和LASSO模型),將不同組織的特異性風險評分融合為統(tǒng)一的多基因評分(圖1)。

打開網(wǎng)易新聞 查看精彩圖片

圖1.OmniPRS框架核心流程

注:是在SNP j處的邊際關(guān)聯(lián)檢驗統(tǒng)計量;是在組織特異性注釋模型f中的第 a個功能類別;是功能類別的系數(shù);是功能類別的LD得分;y是n維表型向量;X是基因型矩陣;β是SNP的邊際效應(yīng);步驟 3 中的三種策略分別是等權(quán)重(EW)模型、貝葉斯模型平均(BMA)和最小絕對收縮和選擇算子(LASSO)模型。

OmniPRS的良好性能和核心優(yōu)勢在系統(tǒng)模擬研究和真實數(shù)據(jù)研究中得到充分驗證,從算法效率到生物學機制解釋都取得一定突破。

模擬研究發(fā)現(xiàn),在不同遺傳力(0.1-0.5)和訓練樣本量(1萬-8萬)下,OmniPRS的預(yù)測精度(R2)始終領(lǐng)先;在稀疏遺傳模型(1%因果SNP比例),OmniPRS較貝葉斯方法PRScs精度提升12.6%;在多基因混合模型(SNP效應(yīng)呈高斯混合分布),精度提升13.5%,凸顯其對復(fù)雜遺傳信號的解析能力;依托解析型混合模型解決方案,OmniPRS的計算速度較PRScs快35倍,單次分析耗時從小時級縮短至分鐘級,可輕松處理百萬級樣本數(shù)據(jù)。

在真實數(shù)據(jù)分析中,相比傳統(tǒng)方法C+T,OmniPRS對定量性狀(如身高)和二元性狀(如精神分裂癥)的預(yù)測精度平均提升52.31%和19.83%;相較于同類功能注釋整合方法LDpred-funct,精度進一步優(yōu)化3.92%;特別是在BMI性狀中,OmniPRS預(yù)測精度提升最為顯著,R2從C+T的0.037躍升至0.172(+366.67%)。

本研究也探索了不同LD參考面板對PRS預(yù)測性能的影響,相比傳統(tǒng)1000 Genomes Project的LD參考面板數(shù)據(jù),采用UK Biobank(5,000例歐洲樣本)作為參考面板在UKB人群中進行預(yù)測時,所有方法的平均預(yù)測精度提升15.44%。在這種情況下OmniPRS表現(xiàn)尤為穩(wěn)?。涸谏砀哳A(yù)測中,其精度較其他方法(如LDpred-funct)提升32.34%,且與功能注釋整合方法SBayesRC相比,BMI預(yù)測精度仍領(lǐng)先3.11%。

此外,為了應(yīng)對日益增長的跨種族GWAS數(shù)據(jù)和現(xiàn)有模型針對非歐洲人群的預(yù)測水平較低的挑戰(zhàn),該研究將OmniPRS擴展到了跨種族版本的OmniPRS-x。在東亞、南亞、非洲等非歐人群的身高預(yù)測中,OmniPRS較單一族群模型精度提升55.53%,與跨種族PRS專用方法(如CT-SLEB,PRS-CSx)表現(xiàn)相當,為消除遺傳研究中的“歐洲中心偏差”提供新路徑。

打開網(wǎng)易新聞 查看精彩圖片

圖2.來自UK Biobank的多種族的身高預(yù)測。注:紅色:在歐洲(EUR)祖先的GWAS中訓練的PRS模型,并使用來自UK Biobank的目標人群樣本進行驗證,包括(A)東亞人群(EAS)、(B)南亞人群(SAS)、(C)美洲人群(AMR)和(D)非洲人群(AFR);橙色:在目標人群中訓練和驗證的PRS模型;藍色:在基礎(chǔ)人群和目標人群中訓練的PRS模型,用于在目標人群的UKB人群中進行跨種族預(yù)測。不同人群的GWAS匯總統(tǒng)計數(shù)據(jù)來自GIANT數(shù)據(jù)庫(PMID:36224396)。

OmniPRS是對全基因模型理論在應(yīng)用層面的一次大膽嘗試,揭示了組織特異性調(diào)控網(wǎng)絡(luò)在復(fù)雜疾病中的關(guān)鍵作用,并為PRS的臨床轉(zhuǎn)化提供了有效的工具。OmniPRS目前也存在一些局限性,例如對罕見變異的覆蓋程度、跨性狀和跨人群預(yù)測性能都還存在不足。未來計劃通過整合多人群數(shù)據(jù)和優(yōu)化注釋模型,進一步提升遺傳風險預(yù)測的準確性和適用性。

OmniPRS的代碼和R包已開源(GitHub: https://github.com/biostatShao/OmniPRS),供全球科研人員免費使用,也歡迎跨學科合作,共同推動精準醫(yī)學的發(fā)展。

10.1016/j.xgen.2025.100850

制版人: 十一

學術(shù)合作組織

(*排名不分先后)

打開網(wǎng)易新聞 查看精彩圖片


戰(zhàn)略合作伙伴

(*排名不分先后)

(*排名不分先后)

轉(zhuǎn)載須知


【非原創(chuàng)文章】本文著作權(quán)歸文章作者所有,歡迎個人轉(zhuǎn)發(fā)分享,未經(jīng)作者的允許禁止轉(zhuǎn)載,作者擁有所有法定權(quán)利,違者必究。

BioArt

Med

Plants

人才招聘

會議資訊

近期直播推薦