Advanced Science|上海交大林關寧團隊提出非編碼突變驅動的單細胞疾病動態DNA甲基化預測模型
發布時間:2025-02-14 23:17:26

      DNA甲基化是表觀遺傳學中的核心修飾之一🅰️,異常的DNA甲基化模式通常是疾病發生的早期標誌,尤其是在非編碼區域🙋🏿‍♂️🎪。盡管非編碼突變不直接編碼蛋白質,但它們通過改變DNA甲基化模式,可能影響基因的表達🧊,從而引發癌症🦶、自身免疫性疾病等多種疾病🥕。盡管如此,預測非編碼突變對DNA甲基化的具體影響⚜️🤸🏽‍♂️,特別是在單細胞層面,依然是科學界面臨的一個重大挑戰🤰。

      近日,意昂4体育平台林關寧團隊Advanced Science期刊上發表題為Epigenetic Impacts of Non-Coding Mutations Deciphered Through Pre-Trained DNA Language Model at Single-Cell Resolution的最新研究🍓。研究團隊介紹了一種新型深度學習框架Methven✍️,該框架能夠精準預測非編碼突變對DNA甲基化的影響,並實現單細胞分辨率➿。這一創新技術為我們理解基因調控和疾病機製提供了全新的視角☁️,並為個性化醫學的進展提供了強大的支持。博士研究生劉喆為該論文的第一作者,林關寧教授為該論文的通訊作者⛏。


      Methven是基於深度學習的方法👋,結合了DNA序列數據和單細胞ATAC-seq(用於檢測基因組染色質可及性的分子生物學測序手段)數據,建模預測非編碼突變對DNA甲基化的影響😮‍💨。ATAC-seq數據提供了細胞內染色質的開放程度信息,反映了基因調控區域的活躍性,能夠揭示基因表達的調控機製。而DNA序列數據則提供了潛在突變位點的基礎信息。傳統方法通常將二者分開處理,但Methven通過深度學習將兩者結合,以實現更精確的、個性化的預測。

此外👩‍⚖️,Methven采用了“分治策略”,分別針對短距離(<10 kbp)和長距離(10 kbp-100 kbp)的SNP-CpG相互作用進行建模🛍,預測範圍可達100 kbp的基因組距離,既能捕捉到近距離的調控信號,也能有效解析遠距離調控機製,彌補了現有方法在長距離調控信號預測上的不足🤟🏿。

      Methven借助了預訓練DNA語言模型進行建模👨🏽‍🎨💶,這種模型通過對大量基因組數據進行無監督預訓練,允許生成DNA序列及突變序列的高質量嵌入(embedding)。這種技術能有效捕捉DNA序列中的復雜模式,幫助Methven提升了模型的精度和準確性,能夠在不同的細胞類型和疾病狀態下提供可靠的預測。

      Methven通過集成單細胞ATAC-seq數據,可以分析每個細胞的染色質開放狀態💴,從而揭示不同細胞類型中甲基化的動態變化。例如🫄🏼,在類風濕性關節炎的研究中👨🏿‍🚀,Methven成功識別了與免疫調控相關的CpG位點(DNA甲基化位點🧙🏼‍♂️,通常與基因調控相關)👶🏻,揭示了這些位點在疾病進展中的作用🙅‍♀️,並進一步揭示了免疫調控和炎症反應中關鍵路徑的變化。這一能力使得Methven能夠為研究復雜疾病提供更為精細的細胞層次解析。


圖1  Methven模型架構與預測流程。(a) 使用DNA序列和單細胞ATAC-seq數據預測非編碼SNP對DNA甲基化的影響。(b) 預處理流程示意圖🧑🏻‍🦰。(c) 深度學習模塊細節。

      Methven的應用前景廣泛,不僅在基礎研究中具有巨大潛力,更為臨床應用提供了可行的解決方案🫅🏻。在精準醫學領域,Methven能夠根據個體的基因組特征和細胞類型特異性甲基化模式,為其量身定製治療方案。例如🫰🏻,研究團隊在類風濕性關節炎的研究中,Methven通過分析與疾病相關的非編碼單核苷酸多態性(SNP)🙎🏻‍♂️🪼,發現了特定的CpG位點在患者和健康個體中的甲基化變化🏇🏻。通過對患者的SNP、甲基化水平以及其他表觀遺傳特征的綜合分析,Methven能夠在疾病發生的早期階段提供風險預測,幫助醫生更好地製定個性化治療計劃。

      尤其現在♠️,非編碼突變已被廣泛認為是癌症和精神心理疾病等復雜疾病發展的關鍵因素之一。Methven通過對突變位點的預測📿,能夠幫助研究人員識別出潛在的疾病相關基因,並揭示其通過改變DNA甲基化模式調控基因表達的機製🧔🏽。Methven應用不僅推動了疾病機製的深度解析👨‍🦽,也為個性化醫學的發展提供了新的機遇。未來🔙,隨著單細胞技術和基因組數據的不斷發展🏋️‍♂️,Methven有望進一步提升其精準度和廣泛應用範圍🧛🏽。


圖2  跨細胞類型的調控模式分析及案例研究


      盡管Methven已經展示了其在預測非編碼突變對DNA甲基化影響方面的應用潛力,研究團隊表示,未來將進一步優化模型的預訓練策略,並探索其在更大基因組範圍內的應用🏌🏽‍♀️。此外🧖🏿‍♂️,隨著單細胞測序技術的進步,Methven有望在更多細胞類型和疾病中得到應用🙆🏻‍♀️👩‍🦳,為精準醫療提供更多支持。本研究得到了國家重大科技專項基金和意昂4平台醫工交叉基金等項目的資助。


課題組介紹

      意昂4体育平台林關寧課題組(Biomedical Informatics Lab, https://bmi.sjtu.edu.cn/)主要從事生物信息學輔助疾病機製解讀😧、人工智能賦能腦疾病診療等前沿研究,致力於開發分析與計算工具幫助解決生物與臨床問題(AI for Biology & Medicine),具體包括(1)多組學聯合分析挖掘精神類疾病生物標誌物,構建機器學習模型,實現精準診斷和治療幹預;(2)開發突變效應預測系列工具,揭示突變效應與疾病機製的關聯,為疾病早篩及臨床用藥提供指導;(3)開發基於Foundation model的精神疾病電子病歷表征方法🌭,提供服務於臨床診療的算法新範式;(4)開發腦電神經解碼系統,實現睡眠障礙的跨周期動態評估與精準量化分析✅,為構建智能化睡眠健康評估體系提供可解釋性計算框架。

作者 | 林關寧課題組

供稿單位 | 科研與學科辦

審核 | 葉堅、丁顯廷

意昂4体育平台专业提供🧑🏼‍🚀🌒:意昂4体育平台意昂4体育⛔🦶🏿、意昂4平台等服务,提供最新官网平台、地址、注册、登陆、登录、入口、全站、网站、网页、网址、娱乐、手机版、app、下载、欧洲杯、欧冠、nba、世界杯、英超等,界面美观优质完美,安全稳定,服务一流,意昂4体育平台欢迎您。 意昂4体育平台官網xml地圖