近日,團(tuán)隊(duì)成員2021級(jí)研究生梁婉瑩、團(tuán)隊(duì)創(chuàng)始人湯庸教授以及團(tuán)隊(duì)合作導(dǎo)師朱佳教授在計(jì)算機(jī)領(lǐng)域頂級(jí)期刊ACM Computing Surveys發(fā)表題為 “A Survey of Multi-modal Knowledge Graphs: Technologies and Trends”的論文。論文在線鏈接為https://dl.acm.org/doi/10.1145/3656579。
人類感知系統(tǒng)本質(zhì)上是多模態(tài)的,因?yàn)橹車奈矬w通常由多種信號(hào)組合表示,例如視覺和文本。多模態(tài)知識(shí)圖譜將結(jié)構(gòu)化知識(shí)表示與多種模態(tài)結(jié)合起來,是知識(shí)圖譜的強(qiáng)大擴(kuò)展。盡管多模態(tài)知識(shí)圖譜可以處理某些類型的任務(wù)或標(biāo)準(zhǔn)知識(shí)圖譜無法處理的查詢,并可有效地解決一些標(biāo)準(zhǔn)問題,但仍然缺乏對(duì)多模態(tài)知識(shí)圖譜的廣泛接受的定義。該論文提供了多模態(tài)知識(shí)圖譜的嚴(yán)格定義,并基于現(xiàn)有方法如何解決四個(gè)基本挑戰(zhàn)(表示、融合、對(duì)齊和轉(zhuǎn)換)的分類方案,這些挑戰(zhàn)對(duì)于改進(jìn)多模態(tài)知識(shí)圖譜至關(guān)重要。該論文的分類方案靈活,可以輕松地納入新的方法,并可以比較兩種方法在如何解決上述基本挑戰(zhàn)中的表現(xiàn)。作為對(duì)多模態(tài)知識(shí)圖譜的首次全面調(diào)查,該論文旨在激發(fā)并為人工智能領(lǐng)域的相關(guān)研究人員提供參考。
《ACM Computing Surveys》(《美國計(jì)算機(jī)學(xué)會(huì)計(jì)算概觀》)是ASSOCIATION for COMPUTING MACHINERY出版社旗下的刊物,于1969年創(chuàng)刊,致力于接收計(jì)算機(jī)領(lǐng)域具有代表性的前沿綜述論文,幫助從業(yè)者和研究人員了解迅速發(fā)展的計(jì)算領(lǐng)域前沿科學(xué)問題。該刊屬于中科院SCI一區(qū),影響因子為16.6,實(shí)時(shí)影響因子為21.76,是計(jì)算機(jī)領(lǐng)域國際權(quán)威頂級(jí)期刊之一。