近日,團(tuán)隊(duì)2023級(jí)研究生陸德華、2022級(jí)研究生易子怡等在潘家輝教授、黃海云副研究員的悉心指導(dǎo)下,在中科院二區(qū)期刊《IEEE Transactions on Instrumentation and Measurement》成功錄用學(xué)術(shù)論文“Confdence-Aware Multimodal Network for Driver Drowsiness Detection: Leveraging EEG-EOG Signals Enhanced by Knowledge Distillation”。該論文自2024年10月提交,于2025年7月8日被正式接收。
駕駛員疲勞是導(dǎo)致交通事故的主要原因,因此迫切需要先進(jìn)的疲勞檢測(cè)系統(tǒng)。生理信號(hào)的整合,特別是腦電圖(electroencephalography , EEG)和眼電圖(electrooculography, EOG)在該領(lǐng)域顯示出優(yōu)異的前景。然而,現(xiàn)有的方法面臨多模態(tài)融合精度低和復(fù)雜模型計(jì)算量大的挑戰(zhàn)。在本文中,我們提出了一種新的多模態(tài)疲勞檢測(cè)框架,稱(chēng)為EEG-EOG置信度感知網(wǎng)絡(luò)(EECNet),用于解決上述問(wèn)題。EECNet使用深度通道注意轉(zhuǎn)換(DCAT)模型有效地提取局部和全局EEG特征,而EOGNet則提取EOG特征。置信度感知模塊用于評(píng)估每個(gè)模態(tài)的可靠性,從而提高多模態(tài)信息融合檢測(cè)精度和魯棒性。此外,本文還利用知識(shí)蒸餾(knowledge distillation, KD)來(lái)開(kāi)發(fā)輕量級(jí)模型,從而有效地平衡復(fù)雜性和性能。在公共數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,EECNet超過(guò)了最先進(jìn)的方法,平均準(zhǔn)確率達(dá)到95.68%,從而顯示了其在檢測(cè)駕駛員困倦方面的優(yōu)越性能。
亮點(diǎn):
方法:
EECNet的主要架構(gòu)分為三個(gè)主要部分:?jiǎn)文B(tài)處理、置信度感知融合模塊和分類(lèi)器,如圖1所示。
圖 1 EECNet主體架構(gòu)
首先是單模態(tài)處理。我們使用了不同的方法來(lái)處理EEG和EOG信號(hào)。對(duì)于EEG,我們使用了深通道注意轉(zhuǎn)換器(DCAT)模型。這個(gè)模型擅長(zhǎng)挑選出重要的細(xì)節(jié),包括局部特征和全局特征,這有助于下一步對(duì)數(shù)據(jù)進(jìn)行分類(lèi)。對(duì)于EOG信號(hào),我們首先使用特征提取器Feature Extractor,然后添加GhostModule使處理更加精確更加快速。
在置信度感知融合模塊中,置信度感知模塊首先通過(guò)置信度評(píng)估過(guò)程對(duì)每個(gè)信號(hào)特征關(guān)聯(lián)的可靠性進(jìn)行評(píng)估,然后再對(duì)這些特征進(jìn)行融合。該置信度感知模塊有別于傳統(tǒng)的Maximum Class Probability (MCP), 而是利用True Class Probability (TCP)去更加精確的評(píng)估各個(gè)模態(tài)的置信度。
圖 2 置信度感知模塊架構(gòu)?;貧w任務(wù)用于獲取TCP值。分類(lèi)任務(wù)用于生成預(yù)測(cè)TCP值。
最后,實(shí)現(xiàn)了分類(lèi)器來(lái)執(zhí)行分類(lèi)任務(wù)。該分類(lèi)器作為決策過(guò)程的最后一步,根據(jù)聚合的特征和評(píng)估的置信度確定適當(dāng)?shù)姆诸?lèi)。為了滿(mǎn)足實(shí)際需要,我們?cè)诮處熌P偷幕A(chǔ)上,采用知識(shí)精餾的方法,對(duì)參數(shù)數(shù)量減少的學(xué)生模型進(jìn)行訓(xùn)練。學(xué)生模型和教師模型僅僅有結(jié)構(gòu)層數(shù)的不同。
實(shí)驗(yàn)結(jié)果:
我們?cè)诠_(kāi)數(shù)據(jù)集SEED-VIG上做了大量實(shí)驗(yàn)來(lái)驗(yàn)證EECNet模型和知識(shí)蒸餾方法的有效性。具體的表現(xiàn)如下列各表所示。結(jié)果表明我們的方法能夠在同樣測(cè)試環(huán)境取得非常優(yōu)異的結(jié)果,突出了方法的有效性。
表 1 各模型在SEED-VIG數(shù)據(jù)集分類(lèi)任務(wù)表現(xiàn)
表 2 各模型在SEED-VIG數(shù)據(jù)集回歸任務(wù)表現(xiàn)
表 3 單-多模態(tài)知識(shí)蒸餾前后師生模型的性能比較
結(jié)論:
本研究提出了一種新的多模態(tài)駕駛員疲勞檢測(cè)模型,利用EEG和EOG數(shù)據(jù)來(lái)解決該領(lǐng)域的關(guān)鍵挑戰(zhàn)。該模型解決了諸如多模態(tài)數(shù)據(jù)融合、不同置信水平和模型復(fù)雜性等挑戰(zhàn)。通過(guò)采用信心感知融合和知識(shí)蒸餾,我們開(kāi)發(fā)了一個(gè)既準(zhǔn)確又實(shí)用的模型,可以在現(xiàn)實(shí)世界中使用,正如它在SEED-VIG數(shù)據(jù)集上的表現(xiàn)所證明的那樣。綜上所述,本研究在駕駛疲勞檢測(cè)領(lǐng)域取得了重大進(jìn)展,為今后的研究提供了明確的方向。