該論文收錄在AAAI Conference on Artificial Intelligence 2025(CCF A),題目為《AnchorInv: Few-Shot Class-Incremental Learning of Physiological Signals via Feature Space-Guided Inversion》。
該論文的第一作者是英國(guó)牛津大學(xué)工程科學(xué)系的Chenqi Li,通訊作者是Tingting Zhu和Chenqi Li。
論文鏈接:https://ojs.aaai.org/index.php/AAAI/article/view/33563
在生物醫(yī)學(xué)領(lǐng)域,模型通常基于有限數(shù)據(jù)開(kāi)發(fā),且這些數(shù)據(jù)會(huì)隨著新類別的出現(xiàn)而增量到達(dá),要求在少量數(shù)據(jù)支撐下識(shí)別新類別的同時(shí),需要保留對(duì)舊類別的認(rèn)知且無(wú)需重訓(xùn)整個(gè)模型。此外,現(xiàn)有少樣本類增量學(xué)習(xí)(FSCIL)方法的評(píng)估因其實(shí)驗(yàn)樣本少的特性,對(duì)樣本的選擇極為敏感。
論文提出創(chuàng)新策略 AnchorInv,不同于選擇和存儲(chǔ)原始數(shù)據(jù),其在特征空間中的錨點(diǎn)引導(dǎo)下生成合成樣本,既能保護(hù)隱私,又能為模型微調(diào)提供正則化。在基礎(chǔ)會(huì)話中,訓(xùn)練集被投影到特征空間,各類別錨點(diǎn)存儲(chǔ)在錨點(diǎn)集內(nèi)存中;在增量會(huì)話中,錨點(diǎn)集引導(dǎo)模型逆變換過(guò)程,生成先前見(jiàn)過(guò)類別的代表性樣本,這些逆變換樣本和少樣本訓(xùn)練集隨后被用于微調(diào)骨干網(wǎng)絡(luò),新類別的錨點(diǎn)也會(huì)陸續(xù)添加到錨點(diǎn)集內(nèi)存中,供后續(xù)增量會(huì)話使用。
本研究在生理時(shí)間序列數(shù)據(jù)集BCI-IV 2a、NHIE、GRABMyo上對(duì) AnchorInv 進(jìn)行了評(píng)估,AnchorInv 在 所有增量會(huì)話中均取得了最佳的 Macro-F1 分?jǐn)?shù)。AnchorInv的方法框架圖如圖 1所示。
圖1 Anchorinv的框架總覽圖
研究背景
現(xiàn)有的FSCIL方法通?;趦蓚€(gè)關(guān)鍵假設(shè):一是擁有大量基類來(lái)訓(xùn)練泛化能力強(qiáng)的骨干模型,二是能夠存儲(chǔ)原始樣本以供增量階段使用。但在醫(yī)療場(chǎng)景中,基類數(shù)量通常有限,且直接存儲(chǔ)數(shù)據(jù)會(huì)引發(fā)隱私問(wèn)題。此外,簡(jiǎn)單微調(diào)骨干網(wǎng)絡(luò)會(huì)導(dǎo)致災(zāi)難性遺忘,而生成對(duì)抗網(wǎng)絡(luò)(GAN)等生成式回放方法又存在計(jì)算復(fù)雜性和模式坍塌等問(wèn)題。
近期研究嘗試通過(guò)模型反演技術(shù)(如DeepDream和DeepInv)生成合成樣本,但這些方法主要在標(biāo)簽空間進(jìn)行約束,可能無(wú)法充分防止特征空間的偏移。因此,本研究提出了一種基于特征空間錨點(diǎn)引導(dǎo)的反演方法,通過(guò)生成多樣化的合成樣本來(lái)平衡新舊類別的學(xué)習(xí),同時(shí)保護(hù)數(shù)據(jù)隱私。這一方法在生理信號(hào)數(shù)據(jù)集上表現(xiàn)出色,超越了現(xiàn)有方法的性能。
研究方法
1. 模型推理(Model Inference)
模型推理過(guò)程的目的是定義模型對(duì)輸入樣本的處理流程,其分為特征提取和分類兩個(gè)階段。特征提取階段通過(guò)骨干網(wǎng)絡(luò)將維度為H×W(H為通道數(shù),W為時(shí)間步)的輸入樣本映射到特征空間,得到維度為D的嵌入向量,即
分類階段采用基于度量的分類器,通過(guò)計(jì)算嵌入向量與類別原型的相似度進(jìn)行預(yù)測(cè),其中,相似度函數(shù)s基于負(fù)余弦距離(歸一化后)和溫度參數(shù)T計(jì)算:
其中,分類器參數(shù)? k(t )由每個(gè)類別的平均嵌入(即原型)替代。
2. 特征空間引導(dǎo)的反轉(zhuǎn)(Feature Space-Guided Inversion)
該模塊是本研究的核心,通過(guò)錨點(diǎn)引導(dǎo)生成歷史類別的合成樣本,避免直接存儲(chǔ)原始數(shù)據(jù),正則化模型以防止遺忘,同時(shí)實(shí)現(xiàn)模型對(duì)新類別的高效適應(yīng)。
首先進(jìn)行錨點(diǎn)選擇,對(duì)于每個(gè)會(huì)話t的訓(xùn)練數(shù)據(jù),通過(guò)特征提取器得到特征集,再?gòu)奶卣骷须S機(jī)采樣或者通過(guò)聚類確定聚類中心選取錨點(diǎn)集:
然后是反轉(zhuǎn)階段,從會(huì)話t的選定錨點(diǎn)集中推導(dǎo)出一個(gè)重放集:
其用于正則化特征提取器對(duì)會(huì)話t+1的適應(yīng)。這一推導(dǎo)過(guò)程的自然形式化定義使?jié)撛谥胤艠颖镜那度肱c錨點(diǎn)對(duì)齊,具體通過(guò)最小化算子實(shí)現(xiàn):
其中,L代表平均絕對(duì)誤差(MAE)。該優(yōu)化可以通過(guò)對(duì)隨機(jī)初始化的重放樣本進(jìn)行梯度下降來(lái)實(shí)現(xiàn)。
最后是模型微調(diào),微調(diào)通過(guò)新類別損失和歷史類別損失的加權(quán)組合損失實(shí)現(xiàn):新類別損失與歷史類別損失分別基于當(dāng)前會(huì)話的訓(xùn)練數(shù)據(jù)與所有歷史會(huì)話的合成樣本來(lái)計(jì)算分類交叉熵定義的。通過(guò)最小化該損失來(lái)更新特征提取骨干網(wǎng)絡(luò)和分類器的參數(shù)。
3. 實(shí)驗(yàn)設(shè)計(jì)與結(jié)果
由于少樣本數(shù)據(jù)的隨機(jī)性可能導(dǎo)致性能波動(dòng),論文采用多試驗(yàn)評(píng)估策略:在每個(gè)增量會(huì)話中隨機(jī)采樣M個(gè)訓(xùn)練集,分別訓(xùn)練M個(gè)模型副本。實(shí)驗(yàn)設(shè)置具體如圖2所示,a)和b)分別表示現(xiàn)有文獻(xiàn)中的評(píng)估流程和本研究采用的評(píng)估流程。本研究最終報(bào)告這些復(fù)制實(shí)驗(yàn)的均值和標(biāo)準(zhǔn)差。
圖2 FSCIL的評(píng)估流程概況
實(shí)驗(yàn)分別在BCI-IV 2a運(yùn)動(dòng)想象EEG數(shù)據(jù)集、NHIE新生兒缺氧缺血性腦病EEG分級(jí)數(shù)據(jù)集和GRABMyo手勢(shì)識(shí)別EMG數(shù)據(jù)集上進(jìn)行,皆采用1-way 10-shot設(shè)置。實(shí)驗(yàn)使用EEG-Conformer作為骨干網(wǎng)絡(luò)。AnchorInv在三個(gè)數(shù)據(jù)集的所有增量階段均取得最佳Macro-F1 分?jǐn)?shù),尤其在BCI和NHIE數(shù)據(jù)集上分別比最優(yōu)基線方法提升2.19%和3.24%,具體結(jié)果參見(jiàn)表1:
表1 Anchorinv與基線方法在三個(gè)數(shù)據(jù)集上的性能比較
研究對(duì)NHIE數(shù)據(jù)集的兩個(gè)基類的錨點(diǎn)集和反演樣本的特征向量進(jìn)行降維可視化(如圖3所示)。結(jié)果表示該方法能精確控制合成樣本在特征空間中的位置,確保其與原始數(shù)據(jù)的統(tǒng)計(jì)特性一致,從而有效保留基類知識(shí)。
圖3 錨點(diǎn)集與反演樣本在特征空間的可視化對(duì)比
消融實(shí)驗(yàn)部分主要研究了AnchorInv方法中關(guān)鍵設(shè)計(jì)選擇對(duì)最終性能的影響,集中在三個(gè)部分:
結(jié)論
本研究針對(duì)生理信號(hào)少樣本類別增量學(xué)習(xí)(FSCIL)中基礎(chǔ)類別有限及數(shù)據(jù)隱私問(wèn)題,提出AnchorInv方法。該方法通過(guò)特征空間錨點(diǎn)引導(dǎo)生成合成樣本,無(wú)需存儲(chǔ)原始數(shù)據(jù),在保護(hù)隱私的同時(shí)緩解災(zāi)難性遺忘。實(shí)驗(yàn)在BCI、NHIE和GRABMyo三個(gè)生理數(shù)據(jù)集上進(jìn)行,結(jié)果顯示AnchorInv在各會(huì)話中均優(yōu)于現(xiàn)有基線方法,尤其在基礎(chǔ)類別有限時(shí)表現(xiàn)突出,有效平衡了歷史知識(shí)保留與新類別適應(yīng),為生理信號(hào)增量學(xué)習(xí)提供了高效解決方案。
撰稿人:陳浩
審稿人:李景聰