8月2日至4日,實(shí)驗(yàn)室王嘉毅和王梓懿同學(xué)參加了在云南昆明舉辦的2023中國(guó)多媒體大會(huì)(ChinaMM2023),并展示了論文《基于小波變換和平行注意力機(jī)制的多源遙感圖像分類方法》 、《基于旋轉(zhuǎn)目標(biāo)感知網(wǎng)絡(luò)的SAR船舶檢測(cè)方法》和《基于Transformer和通道混合并行卷積的高光譜圖像去噪方法》。
基于小波變換和平行注意力機(jī)制的多源遙感圖像分類方法由王嘉毅和張?zhí)旄旰献魍瓿桑摲椒?gòu)建了基于小波變換的特征提取器,能夠充分利用頻域分析技術(shù),在可逆下采樣的過(guò)程中充分捕捉粗/細(xì)粒度級(jí)別特征;同時(shí),提出了基于平行注意力機(jī)制的特征融合器,充分綜合多模態(tài)遙感數(shù)據(jù)的一致性和差異性,完成強(qiáng)相關(guān)性特征的融合和生成,可以顯著提升多源遙感圖像分類的準(zhǔn)確率。
基于旋轉(zhuǎn)目標(biāo)感知網(wǎng)絡(luò)的SAR船舶檢測(cè)方法由王梓懿、尹嘉豪、黃博斌合作完成。為了解決目標(biāo)尺寸變化多樣的問(wèn)題,該方法主干網(wǎng)絡(luò)使用基于多尺度 Transformer 架構(gòu)的 PVTv2,可以更好地保留特征圖的局部連續(xù)性,同時(shí)更好地融合圖像的多尺度特征。同時(shí),為了解決目標(biāo)有多種方向且訓(xùn)練樣本數(shù)量有限的問(wèn)題,將旋轉(zhuǎn)邊界框與 RetinaNet 結(jié)合,有效減少了背景冗余以及噪聲的干擾。
基于Transformer和通道混合并行卷積的高光譜圖像去噪方法由胡帥、龔卓然、上官心語(yǔ)合作完成,模型包括三個(gè)關(guān)鍵模塊:通道混合特征提取模塊、基于塊下采樣的全局增強(qiáng)模塊和自適應(yīng)雙向特征融合模塊。通過(guò)這三個(gè)模塊的相互作用,可以充分結(jié)合全局和局部的特征信息,處理不同區(qū)域中的噪聲和紋理差異,有效提高模型對(duì)空間細(xì)節(jié)信息的恢復(fù)能力。
目前,這三個(gè)工作分別被推薦到《中國(guó)圖象圖形學(xué)報(bào)》和《北京航空航天大學(xué)學(xué)報(bào)》發(fā)表。
2023中國(guó)多媒體大會(huì)由中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)、中國(guó)圖像圖形學(xué)學(xué)會(huì)(CSIG)主辦,CCF多媒體技術(shù)專業(yè)委員會(huì)、CSIG多媒體專業(yè)委員會(huì)、云南大學(xué)承辦,昆明理工大學(xué)、云南師范大學(xué)和云南民族大學(xué)聯(lián)合承辦,參會(huì)人數(shù)超過(guò)1000人,通過(guò)面對(duì)面交流,共同促進(jìn)多媒體領(lǐng)域的蓬勃發(fā)展。