近年來(lái),全球范圍內(nèi)涌現(xiàn)了很多大型生物樣本庫(kù)(Biobank),為全基因組關(guān)聯(lián)研究(GWAS)提供了重要的研究資源?;陔娮咏】涤涗?,生物樣本庫(kù)的研究范疇已從傳統(tǒng)的數(shù)量性狀、質(zhì)量性狀拓展到結(jié)構(gòu)更為復(fù)雜的數(shù)據(jù)形式。例如,生存數(shù)據(jù)表型既可以描述事件是否發(fā)生,也可以描述事件發(fā)生的時(shí)間;多分類表型可以更準(zhǔn)確描述個(gè)體的健康、亞健康和疾病狀態(tài),比傳統(tǒng)的二分類表型更全面和細(xì)致;在多時(shí)間點(diǎn)重復(fù)測(cè)量的數(shù)量性狀常被稱為縱向數(shù)據(jù)表型,其能夠表征健康狀況的動(dòng)態(tài)演變規(guī)律?;谶@些更復(fù)雜數(shù)據(jù)形式的表型數(shù)據(jù)進(jìn)行GWAS可以更有效識(shí)別出與健康狀況密切相關(guān)的遺傳變異,為解析復(fù)雜性狀的遺傳結(jié)構(gòu)提供全新視角。
基因環(huán)境交互作用(Gene-Environment Interaction, G×E)是指基因和環(huán)境因素共同作用于個(gè)體性狀或疾病風(fēng)險(xiǎn)的現(xiàn)象。具體來(lái)說(shuō),基因的作用可能會(huì)因環(huán)境的不同而改變,而環(huán)境對(duì)個(gè)體的影響也可能因基因的差異而有所不同。針對(duì)大型生物樣本庫(kù)的全基因組基因-環(huán)境交互作用分析存在樣本量大、表型分布不平衡、樣本之間具有親緣相關(guān)性、樣本具有復(fù)雜的群體結(jié)構(gòu)等實(shí)際困難。針對(duì)數(shù)量性狀和質(zhì)量性狀,已有算法可以處理上述困難【1-3】。但針對(duì)更復(fù)雜結(jié)構(gòu)的數(shù)據(jù)形式,比如生存數(shù)據(jù)表型、多分類數(shù)據(jù)表型和縱向數(shù)據(jù)表型,仍缺乏有效的解決方案,這也導(dǎo)致基因-環(huán)境交互作用分析尚未得到充分發(fā)展。
2025年3月29日,北京大學(xué)基礎(chǔ)醫(yī)學(xué)院的畢文健團(tuán)隊(duì)與中國(guó)科學(xué)院數(shù)學(xué)與系統(tǒng)科學(xué)研究院張紀(jì)峰、趙延龍團(tuán)隊(duì)合作,在Nature Communications期刊發(fā)表工作Efficient and accurate framework for genome-wide gene-environment interaction analysis in large-scale biobanks。該工作提出了一個(gè)針對(duì)復(fù)雜數(shù)據(jù)結(jié)構(gòu)表型的通用基因-環(huán)境作用分析框架SPAGxECCT,并基于數(shù)值模擬和UK Biobank實(shí)際數(shù)據(jù)分析驗(yàn)證了算法的有效性,找出了多個(gè)顯著的具有基因-環(huán)境交互作用的遺傳位點(diǎn)。

SPAGxECCT算法具有以下特性:1)用鞍點(diǎn)近似-正態(tài)分布分析混合策略,提升分析準(zhǔn)確性的同時(shí)兼顧運(yùn)算速度;2)適用于多種復(fù)雜數(shù)據(jù)結(jié)構(gòu)表型(數(shù)量表型、質(zhì)量表型、生存表型和多分類表型等)的分析;3)可擴(kuò)展至SPAGxEmixCCT算法,適用于跨種族或混合人群的分析;4)可擴(kuò)展至SPAGxEmixCCT-local算法,利用局部血統(tǒng)(local ancestry)以提升針對(duì)混合人群分析的統(tǒng)計(jì)效力;5)可擴(kuò)展至SPAGxE+算法,適用于具有親緣相關(guān)性樣本的分析。R包可在網(wǎng)站下載(https://github.com/YuzhuoMa97/SPAGxECCT)。
北京大學(xué)基礎(chǔ)醫(yī)學(xué)院22級(jí)博士生馬雨茁為本文的第一作者,北京大學(xué)基礎(chǔ)醫(yī)學(xué)院畢文健研究員為本文的通訊作者。中國(guó)科學(xué)院數(shù)學(xué)與系統(tǒng)科學(xué)研究院張紀(jì)峰研究員和趙延龍研究員是本項(xiàng)工作的主要貢獻(xiàn)者。
畢文健博士畢業(yè)于中國(guó)科學(xué)院數(shù)學(xué)與系統(tǒng)科學(xué)研究院,先后在美國(guó)圣裘德兒童研究醫(yī)院和密歇根大學(xué)從事博士后研究,在領(lǐng)域內(nèi)具有重要影響的期刊或會(huì)議上發(fā)表學(xué)術(shù)論文30余篇。作為第一作者或通訊作者,部分工作發(fā)表于Nature Genetics (2022), The American Journal of Human Genetics (2019, 2020, 2021, 2023), Nature Communications (2025a, 2025b, 2025c), Genetics, Biostatistics等期刊。畢文健博士于2021年6月加入北京大學(xué)基礎(chǔ)醫(yī)學(xué)院組建統(tǒng)計(jì)遺傳學(xué)、生物信息學(xué)實(shí)驗(yàn)室,2021年度入選國(guó)家級(jí)青年高層次人才計(jì)劃,主持國(guó)家自然科學(xué)基金面上項(xiàng)目、智慧診療專項(xiàng)項(xiàng)目、中韓國(guó)際合作項(xiàng)目,參與科技部重點(diǎn)專項(xiàng)等項(xiàng)目。研究方向涉及全基因組關(guān)聯(lián)分析、生物醫(yī)學(xué)大數(shù)據(jù)分析、基于人工智能的遺傳學(xué)分析等相關(guān)算法設(shè)計(jì)?,F(xiàn)因科研工作需要,公開(kāi)招聘博士后1-2名,數(shù)據(jù)分析員1-2名,實(shí)驗(yàn)室管理人員1名。歡迎感興趣的研究人員應(yīng)聘。新錄用人員的人事管理方式按北京大學(xué)相關(guān)規(guī)定執(zhí)行。招聘將堅(jiān)持公開(kāi)、公平、競(jìng)爭(zhēng)、擇優(yōu)的原則,經(jīng)面試考核后擇優(yōu)錄取,待遇優(yōu)厚。
詳情可見(jiàn)課題組網(wǎng)站https://www.x-mol.com/groups/wenjianb。
https://rdcu.be/efCCa
制版人: 十一
參考文獻(xiàn)
1 Zhong, W., Chhibber, A., Luo, L., Mehrotra, D.V. & Shen, J. A fast and powerful linear mixed model approach for genotype-environment interaction tests in large-scale GWAS.Briefings in Bioinformatics24, bbac547 (2023).
2 Bi, W. et al. A fast and accurate method for genome-wide scale phenome-wide G×E analysis and its application to UK Biobank.The American Journal of Human Genetics105, 1182-1192 (2019).
3 Westerman, K.E. et al. GEM: scalable and flexible gene–environment interaction analysis in millions of samples.Bioinformatics37, 3514-3520 (2021).
學(xué)術(shù)合作組織
(*排名不分先后)

戰(zhàn)略合作伙伴
(*排名不分先后)
(*排名不分先后)
轉(zhuǎn)載須知
【非原創(chuàng)文章】本文著作權(quán)歸文章作者所有,歡迎個(gè)人轉(zhuǎn)發(fā)分享,未經(jīng)作者的允許禁止轉(zhuǎn)載,作者擁有所有法定權(quán)利,違者必究。
BioArt
Med
Plants
人才招聘
會(huì)議資訊
近期直播推薦
熱門跟貼