91一级特黄大片|婷婷中文字幕在线|av成人无码国产|日韩无码一二三区|久久不射强奸视频|九九九久久久精品|国产免费浮力限制

MEDIA | 基于多任務學習的腦成像遺傳學結構化稀疏典型相關分析

該論文發(fā)表于Medical Image Analysis(中科院1區(qū),IF= 10.7),題目為《Multi-task learning based structured sparse canonical correlation analysis for brain imaging genetics》。

韓國加圖立大學的Mansu Kim為此文第一作者。賓夕法尼亞大學佩雷爾曼醫(yī)學院的Li Shen為此文的通訊作者。

論文鏈接:

https://www.sciencedirect.com/science/article/pii/S136184152100342X

論文概要

腦成像技術和高通量基因數(shù)據(jù)獲取技術的進步使得研究者可以獲取大量的多模態(tài)數(shù)據(jù)。盡管稀疏典型相關分析是一種強大的用于特征選擇的雙多變量關聯(lián)分析技術,但在實際研究中整合多模態(tài)成像遺傳數(shù)據(jù)和獲得對成像遺傳結果有生物學意義的解釋方面仍然面臨重大挑戰(zhàn)。在本研究中,作者提出了一種新的基于多任務學習的結構化稀疏典型相關分析( MTS2CCA ),以提供可解釋的結果,并提高成像遺傳學研究中的集成。我們在模擬和真實的成像基因數(shù)據(jù)上與最先進的競爭方法進行了比較研究在模擬數(shù)據(jù)上,我們提出的模型在典型相關系數(shù)、估計精度和特征選擇精度方面都取得了最好的性能。在真實的成像基因數(shù)據(jù)上,我們提出的模型揭示了與睡眠相關的單核苷酸多態(tài)性和腦區(qū)的有希望的特征。所識別的特征可用于使用有前途的影像學遺傳生物標志物來改善臨床評分預測。作者設想的未來方向是將論文方法應用到其他的神經(jīng)或精神疾病隊列中,例如阿爾茨海默癥或帕金森癥患者,以證明論文方法的可推廣性。

研究背景

隨著高通量基因測序和神經(jīng)影像技術的飛速發(fā)展,腦成像遺傳學(Brain Imaging Genetics)已成為連接遺傳變異與腦表型的重要交叉學科。其核心目標是通過整合基因數(shù)據(jù)(如單核苷酸多態(tài)性,SNP)和多模態(tài)腦成像數(shù)據(jù)(如功能磁共振成像fMRI、結構磁共振成像sMRI、擴散磁共振成像dMRI),揭示遺傳因素如何影響大腦結構與功能,進而解析神經(jīng)系統(tǒng)疾病(如阿爾茨海默病、精神分裂癥)的生物學機制。然而,這一領域面臨以下關鍵挑戰(zhàn):

1) 現(xiàn)有方法多局限于雙模態(tài)分析,難以同時處理多模態(tài)成像數(shù)據(jù)。

2) 傳統(tǒng)模型未充分利用先驗生物結構(如基因的連鎖不平衡塊、腦功能網(wǎng)絡),導致特征選擇結果難以解釋。

3) 在高維小樣本數(shù)據(jù)下,現(xiàn)有方法易過擬合,且對低相關性信號的捕捉能力有限。

4) CCA模型存在由于數(shù)據(jù)的高維性導致過擬合的風險較高的缺陷。

方法與結果分析

針對上述挑戰(zhàn),論文提出基于多任務學習的結構化稀疏典型相關分析(MTS2CCA)模型,通過多任務學習同時分析多模態(tài)成像數(shù)據(jù)(如fMRI和dMRI),并共享遺傳數(shù)據(jù)的特征表示。引入GraphNet懲罰項,利用基因的連鎖不平衡(LD)矩陣和腦網(wǎng)絡結構,約束權重矩陣,提升生物學合理性。設計交替迭代重加權算法(Alternating Iteratively Reweighted Algorithm),理論證明其收斂性,并實現(xiàn)高效計算。

MTS2CCA的模型定義如下:

其中,Ψ和Ω是控制稀疏性和納入有意義的生物結構的懲罰函數(shù)。提出MTS2CCA的原因如下。首先,多任務框架是一種高效和有良好魯棒性的方法,可以將不同的成像模式一起學習。通過對兩個典型權重矩陣(即U和V)施加l2,1范數(shù)正則化,該模型可以同時學習多個影像遺傳學關聯(lián)對。這有助于模型識別與同一腦區(qū)多模態(tài)成像測量相關的共同遺傳標記。其次,圖形傳輸網(wǎng)懲罰基于先驗網(wǎng)絡信息鼓勵典范加載向量中的相關元素具有相似性。因此,我們使用圖形傳輸網(wǎng)懲罰來融合先驗網(wǎng)絡信息。

通常,使用公共坐標空間和單腦圖譜提取來自不同模態(tài)的成像測量。盡管每種成像模態(tài)可能捕獲不同的大腦表型,但由于結構-功能的耦合,這些多模態(tài)測量具有密切的關系。例如,許多研究報道結構網(wǎng)絡可以提供功能網(wǎng)絡的主干,結構-功能網(wǎng)絡耦合與高階認知過程相關。因此文章提出了一種算法,在每個區(qū)域的所有多模態(tài)測量上使用l2范數(shù)來處理共線性,然后應用l1范數(shù)來選擇相關的區(qū)域。l2,1范數(shù)懲罰的形式定義如下:

因此,在這項工作中,作者對成像規(guī)范權重矩陣(即V )施加l2,1范數(shù)懲罰,以選擇考慮多模態(tài)成像測量的共同特征,還對遺傳正則權重矩陣(即U )施加懲罰,以學習和選擇每個成像模態(tài)對應的遺傳成分。

除此之外,許多研究人員證明,可以使用大腦和基因組中有意義的網(wǎng)絡結構來建模SNPs和腦成像特征。這些全面的網(wǎng)絡數(shù)據(jù)有助于提高每個模態(tài)中有意義的生物標志物的識別。因此,引入一個圖形傳輸網(wǎng)懲罰來包含這些信息,定義如下:

式中,矩陣Lu和Lvk分別為基因組和多模型腦成像中網(wǎng)絡結構的圖拉普拉斯算子。圖的拉普拉斯算子定義為L = D-A,其中D是網(wǎng)絡A的度矩陣。這種正則化鼓勵當網(wǎng)絡中的節(jié)點具有高連通性時,其權重或系數(shù)是相等或相似的。

論文提出了一種交替迭代重加權的方法來獲得方程中的U和V。MTS2CCA的優(yōu)化算法如下:

算法1 MTS2CCA優(yōu)化算法

 

(1)仿真實驗結果:

研究人員應用嵌套五折交叉驗證策略來檢驗模型的性能。表1中比較了典型相關系數(shù)(CCC)的訓練和測試性能。當真實CCC為高(X vs. Y1)時,所有方法普遍表現(xiàn)良好。當真實CCC為中等(X vs. Y2)時,多任務CCA模型(MTS2CCA、MTGSCCA、MTSCCA和JCBSCCA)優(yōu)于單任務CCA模型。當真實CCC極低(X vs. Y3)時,所提出的模型優(yōu)于所有競爭方法。

表1 典型相關系數(shù)(CCC)的訓練和測試性能 

論文比較了模型的參數(shù)敏感性。通過改變參數(shù)從0.01到100來測量CCC,比例因子為10,將其余參數(shù)固定1。如圖1所示,對于除TCCA外的所有方法,CCC曲線穩(wěn)定且對β1不敏感,這控制了數(shù)據(jù)集X的稀疏性。然而,對于β2,CCC曲線從100或更高下降,這控制了數(shù)據(jù)集Y的稀疏性。在TCCA中,CCC曲線穩(wěn)定且對β1和β2都不敏感。對于MTS2CCA和JCBSCCA,CCC曲線看起來是穩(wěn)定的,并且對λ1和λ2不敏感,其中它控制了數(shù)據(jù)集X和Y的網(wǎng)絡信息融合水平。對于MTGSCCA,CCC曲線隨著λ的增加而下降;Λ控制了數(shù)據(jù)集X的合并組結構的水平。這些發(fā)現(xiàn)表明,與GroupLasso相比,具有圖形傳輸網(wǎng)懲罰的CCA在合并先驗知識方面更穩(wěn)定。帶有l(wèi)2,1正則項的CCA和Fused Lasso對多模態(tài)數(shù)據(jù)集成設置都比較敏感。

圖1 CCA模型的參數(shù)敏感性

作者通過計算曲線下面積( AUC )來評估各種CCA模型的特征選擇精度。結果表明,多任務CCA模型對信號的檢測性能優(yōu)于單任務CCA模型,如表2所示。具體來說,多任務CCA模型對低相關水平具有魯棒性,而SCCA和TCCA則不具有魯棒性。

表2 特征選擇準確性

圖3顯示出,除TCCA外,其他方法之間在運行時間上無顯著性差異。除TCCA和SCCA外,各方法在內(nèi)存使用上無顯著性差異,驗證了所提算法的有效性和高效性。

表3 預測性能的比較

(2)真實影像遺傳學數(shù)據(jù)上的實驗結果:

在真實數(shù)據(jù)實驗中,作者收集了神經(jīng)影像學數(shù)據(jù),包括靜息態(tài)功能磁共振成像(rs-fMRI)和擴散加權磁共振成像(dMRI),以及來自HCP數(shù)據(jù)庫的291名參與者的基因分型數(shù)據(jù)。

作者評估了所提出的基于典型相關系數(shù)(CCC)的多任務成像遺傳學關聯(lián)模型,包括SNPs與fMRI之間的關聯(lián)( SNP-fMRI )和SNPs與dMRI之間的關聯(lián)( SNP-dMRI )。表4和表5展示了各種最先進的CCA模型計算的多任務成像遺傳關聯(lián)的訓練和測試CCC。對于SNP - fMRI關聯(lián),與TCCA和SCCA相比,MTS2CCA、MTGSCCA、MTSCCA和JCBSCCA得到最優(yōu)異的訓練CCC和相對良好的測試CCC。MTS2CCA在SNP - dMRI和SNP - fMRI任務(上都表現(xiàn)出最高的測試CCC。

表4 fMRI與SNP的典型相關系數(shù)

表5 dMRI與SNP的典型相關系數(shù)

如表6所示,MTS2CCA在RMSE和CC方面優(yōu)于三個多任務CCA模型以及單任務CCA模型,具有更高的典型相關系數(shù)和更好的預測性能估計PSQI評分。

表6 預測性能的比較

實驗結果表明,使用來自真實影像遺傳學數(shù)據(jù)證明了所提模型的臨床益處。確定的MTS2CCA的影像學標志物與認知功能、抑郁和睡眠剝奪相關。此外,鑒定到的MTS2CCA的遺傳標記與睡眠質(zhì)量和睡眠時間相關。這些結果表明,所提出的基于多任務學習的SCCA框架可以為分析腦成像遺傳學數(shù)據(jù)并產(chǎn)生具有生物學意義的發(fā)現(xiàn)提供強有力的工具。

結論

在這項研究中,研究人員提出了一種新的基于多任務學習的結構化稀疏典型相關分析( MTS2CCA ),以提供可解釋的結果,并提高影像遺傳學研究的集成度。我們在模擬和真實的成像遺傳學數(shù)據(jù)上測試了論文的算法。對于模擬數(shù)據(jù),論文證明了所提出的模型在識別更強的典型相關性、估計精度和特征選擇精度方面優(yōu)于幾種最先進的競爭方法。此外,MTS2CCA成功地識別了由預定義的網(wǎng)絡結構產(chǎn)生的關聯(lián)模式。論文的研究使用來自真實影像遺傳學隊列的SNP、dMRI和fMRI數(shù)據(jù)證明了所提模型的臨床益處。MTS2CCA優(yōu)于所有對比模型,具有更高的典型相關系數(shù)和更好的預測性能估計PSQI評分。論文也確定的MTS2CCA的影像學標志物與認知功能、抑郁和睡眠剝奪有關。此外,鑒定到的MTS2CCA遺傳標記與睡眠質(zhì)量和睡眠時間相關。這些實驗結果表明,所提出的基于多任務學習的SCCA框架可以為分析腦成像遺傳學數(shù)據(jù)并產(chǎn)生具有生物學意義的發(fā)現(xiàn)提供強有力的工具。

 

撰稿人:張睿文

審稿人:梁瑾


登錄用戶可以查看和發(fā)表評論, 請前往  登錄 或  注冊。
SCHOLAT.com 學者網(wǎng)
免責聲明 | 關于我們 | 用戶反饋
聯(lián)系我們: