知識圖譜是人工智能在知識工程理論和技術(shù)發(fā)展中的前沿。知識圖譜方法、技術(shù)與應(yīng)用在新一代人工智能由“感知智能”邁向“認知智能”的過程中扮演重要角色。近年來,隨著大規(guī)模知識圖譜的發(fā)布和知識圖譜賦能系統(tǒng)的應(yīng)用,國內(nèi)外學(xué)術(shù)界和產(chǎn)業(yè)界均在多個維度對知識圖譜賦能的知識工程進行了研究與開發(fā)。雖然國內(nèi)外學(xué)者在知識圖譜及相關(guān)方向上已取得若干研究成果,但知識圖譜賦能的知識工程尚未形成成熟的理論體系、技術(shù)方法、應(yīng)用與系統(tǒng)實踐,仍有眾多有待解決的具有挑戰(zhàn)性的難題。本專題旨在促進知識圖譜賦能的知識工程研究、開發(fā)與應(yīng)用,及時、集中、全面地報道知識圖譜賦能的知識工程在理論、方 法、技術(shù)、系統(tǒng)與應(yīng)用實踐等方面的最新成果和進展。
專題特邀編審
掃碼查看
專題序言&特邀編審簡介
1 文 章 閱 讀
SS-GCN:情感增強和句法增強的方面級情感分析模型
李帥 徐彬 韓祎珂 廖同鑫
摘要: 方面級情感分析(Aspect-Based Sentiment Analysis,ABSA)作為知識圖譜下游應(yīng)用,屬于細粒度情感分析任務(wù),旨在理解人們對評價目標(biāo)在方面層次的情感極性。近年來,相關(guān)研究已經(jīng)取得顯著進步,但現(xiàn)有方法側(cè)重于利用句子內(nèi)的順序性或句法依賴約束,而沒有充分利用上下文詞與方面詞之間的依賴類型。此外,現(xiàn)有的基于圖卷積神經(jīng)網(wǎng)絡(luò)模型對節(jié)點特征保留的能力不足。針對該問題,首先,在句法依賴樹的基礎(chǔ)上,充分挖掘上下文詞與方面詞之間的依賴類型,將其融入依賴圖的構(gòu)建;其次,定義了一個“敏感關(guān)系集合”,利用它來構(gòu)建輔助句以增強特定上下文詞與方面詞之間的關(guān)聯(lián)性,同時結(jié)合情感知識網(wǎng)絡(luò)SenticNet以增強句子的依賴圖,進而改進圖神經(jīng)網(wǎng)絡(luò)的構(gòu)建;最后,引入上下文保留機制,來減小節(jié)點特征在多層圖卷積神經(jīng)網(wǎng)絡(luò)中的信息損失。提出的SS-GCN模型將并行學(xué)習(xí)到的句法表示和上下文表示進行融合以完成情感增強和句法增強。在3個公開數(shù)據(jù)集上進行了廣泛的實驗,證明了SS-GCN的有效性。
引用本文:李帥, 徐彬, 韓祎珂, 廖同鑫. SS-GCN:情感增強和句法增強的方面級情感分析模型[J]. 計算機科學(xué), 2023, 50(3): 3-11.
掃碼閱讀全文
基于動態(tài)記憶和雙層重構(gòu)強化的知識圖譜至文本轉(zhuǎn)譯模型
馬廷淮 孫圣杰 榮歡 錢敏峰
摘要: 知識圖譜轉(zhuǎn)譯文本(Graph-to-Text)是知識圖譜領(lǐng)域中一個新的任務(wù),旨在將知識圖譜轉(zhuǎn)化為描述該知識的可讀性文本。隨著近年來研究的不斷深入,知識圖譜轉(zhuǎn)譯文本的生成技術(shù)已經(jīng)被應(yīng)用于商品評論生成、推薦解釋生成、論文摘要生成等領(lǐng)域?,F(xiàn)有方法中的轉(zhuǎn)譯模型均采用先規(guī)劃后實現(xiàn)的方式,未能根據(jù)已生成文本動態(tài)調(diào)整規(guī)劃且未按靜態(tài)內(nèi)容規(guī)劃對知識進行跟蹤,導(dǎo)致文本前后語義不連貫。為了提高生成文本語義的連貫性,文中提出了基于動態(tài)記憶和雙層重構(gòu)強化的知識圖譜至文本轉(zhuǎn)譯模型,通過靜態(tài)內(nèi)容規(guī)劃、動態(tài)內(nèi)容規(guī)劃和雙層重構(gòu)機制這3個階段,彌補了知識圖譜與文本之間的結(jié)構(gòu)化差異,在生成文本的同時側(cè)重關(guān)注各三元組中的重要內(nèi)容。與現(xiàn)有的生成模型相比,該模型不僅能緩解知識圖譜與文本之間的結(jié)構(gòu)化差異,還提高了定位關(guān)鍵實體的能力,從而使生成的文本具有更強的事實一致性和語義連貫性。在WebNLG數(shù)據(jù)集上進行了廣泛實驗,結(jié)果表明,在知識圖譜轉(zhuǎn)譯文本的任務(wù)上,所提模型與現(xiàn)有模型相比,內(nèi)容規(guī)劃更加準(zhǔn)確,生成文本語句間的邏輯合理且關(guān)聯(lián)性更強,在BLEU,METEOR,ROUGE,CHRF++等指標(biāo)上優(yōu)于現(xiàn)有模型。
引用本文:馬廷淮, 孫圣杰, 榮歡, 錢敏峰. 基于動態(tài)記憶和雙層重構(gòu)強化的知識圖譜至文本轉(zhuǎn)譯模型[J]. 計算機科學(xué), 2023, 50(3): 12-22.
掃碼閱讀全文
基于關(guān)系約束的上下文感知時態(tài)知識圖譜補全
汪璟玢 賴曉連 林新宇 楊心逸
摘要: 現(xiàn)有的時間知識圖譜補全模型僅考慮四元組自身的結(jié)構(gòu)信息,忽略了實體隱含的鄰居信息和關(guān)系對實體的約束,導(dǎo)致模型在時態(tài)知識圖譜補全任務(wù)上表現(xiàn)不佳。此外,一些數(shù)據(jù)集在時間上呈現(xiàn)不均衡的分布,導(dǎo)致模型訓(xùn)練難以達到一個較好的平衡點。針對這些問題,提出了一個基于關(guān)系約束的上下文感知模型(CARC)。CARC通過自適應(yīng)時間粒度聚合模塊來解決數(shù)據(jù)集在時間上分布不均衡的問題,并使用鄰居聚合器將上下文信息集成到實體嵌入中,以增強實體的嵌入表示。此外,設(shè)計了四元組關(guān)系約束模塊,使具有相同關(guān)系約束的實體嵌入彼此相近,不同關(guān)系約束的實體嵌入彼此遠離,以進一步增強實體的嵌入表示。在多個公開的時間數(shù)據(jù)集上進行了大量實驗,實驗結(jié)果證明了所提模型的優(yōu)越性。
引用本文:汪璟玢, 賴曉連, 林新宇, 楊心逸. 基于關(guān)系約束的上下文感知時態(tài)知識圖譜補全[J]. 計算機科學(xué), 2023, 50(3): 23-33.
掃碼閱讀全文
基于圖神經(jīng)網(wǎng)絡(luò)的多信息優(yōu)化實體對齊模型
陳富強 寇嘉敏 蘇利敏 李克
摘要: 實體對齊是知識融合中的一個關(guān)鍵步驟,旨在發(fā)現(xiàn)知識圖譜間存在對應(yīng)關(guān)系的實體對。知識圖譜融合后可以為下游提供更加廣泛而準(zhǔn)確的服務(wù)?,F(xiàn)有的實體對齊模型對實體名稱和關(guān)系的利用往往不足,在得到實體的向量表示后通過單一的迭代策略或者直接計算得出實體的對齊關(guān)系,忽略了部分有用信息,導(dǎo)致實體對齊的結(jié)果欠佳。針對上述問題,提出了一種基于圖神經(jīng)網(wǎng)絡(luò)的多信息優(yōu)化實體對齊模型。首先,模型的輸入融合了實體名稱中的單詞信息和字符信息,通過注意力機制學(xué)習(xí)關(guān)系的向量表示并利用關(guān)系傳遞信息。在利用實體和關(guān)系的預(yù)對齊結(jié)果修正實體對齊矩陣的基礎(chǔ)上,使用延遲接受算法修正部分錯誤對齊的結(jié)果。所提模型在DBP15K的3個子數(shù)據(jù)集上進行了對比和消融實驗。結(jié)果表明,相比基線模型,其Hits@1指標(biāo)分別提高了4.47%,0.82%和0.46%,Hits@10和MRR指標(biāo)也取得了良好的結(jié)果。通過消融實驗進一步驗證了所提模型的有效性,總體上可以獲得更加準(zhǔn)確的實體對齊結(jié)果。
引用本文:陳富強, 寇嘉敏, 蘇利敏, 李克. 基于圖神經(jīng)網(wǎng)絡(luò)的多信息優(yōu)化實體對齊模型[J]. 計算機科學(xué), 2023, 50(3): 34-41.
掃碼閱讀全文
BGPNRE:一種基于BERT的全局指針網(wǎng)絡(luò)實體關(guān)系聯(lián)合抽取方法
鄧亮 齊攀虎 劉振龍 李敬鑫 唐積強
摘要: 實體-關(guān)系聯(lián)合抽取指從非結(jié)構(gòu)化文本中聯(lián)合抽取出實體-關(guān)系三元組,是信息抽取和知識圖譜構(gòu)建的一項關(guān)鍵任務(wù)。文中提出了一種新的基于全局指針網(wǎng)絡(luò)實體關(guān)系聯(lián)合抽取方法BGPNRE(BERT-based Global Pointer Network for Named Entity-Relation Joint Extraction),首先通過潛在關(guān)系預(yù)測模塊預(yù)測文本中蘊含的關(guān)系,過濾掉不可能存在的關(guān)系,將實體抽取限制在預(yù)測的關(guān)系子集中;其次通過使用基于關(guān)系的全局指針網(wǎng)絡(luò),獲取所有主客體實體的位置;最后通過全局指針網(wǎng)絡(luò)通信模塊,將主客體位置高效率地解碼對齊成一個實體關(guān)系三元組。該方法避免了傳統(tǒng)管道式方法存在的錯誤傳播問題,同時也解決了關(guān)系冗余、實體重疊、Span提取泛化不足等問題。實驗結(jié)果表明,所提方法在多關(guān)系和重疊實體抽取上表現(xiàn)卓越,并且在NYT和WebNLG公共數(shù)據(jù)集上達到了最先進的水平。
引用本文:鄧亮, 齊攀虎, 劉振龍, 李敬鑫, 唐積強. BGPNRE:一種基于BERT的全局指針網(wǎng)絡(luò)實體關(guān)系聯(lián)合抽取方法[J]. 計算機科學(xué), 2023, 50(3): 42-48.
掃碼閱讀全文
基于高階和時序特征的圖神經(jīng)網(wǎng)絡(luò)社會化推薦算法研究
于健 趙滿坤 高潔 王聰源 李亞蓉 張文彬
摘要: 跨項目社會推薦是一種將社交關(guān)系整合到推薦系統(tǒng)中的方法。社會化推薦中包含用戶-項目交互圖和社交網(wǎng)絡(luò)圖,用戶是連接這兩個圖的橋梁,其表示學(xué)習(xí)對提升社會化推薦的性能至關(guān)重要。然而,現(xiàn)有方法主要使用用戶或項目的靜態(tài)屬性和社交網(wǎng)絡(luò)中的顯式朋友關(guān)系來進行表示學(xué)習(xí),用戶和項目交互的時序信息及隱式朋友關(guān)系未得到充分利用。因此,在社會化推薦中,如何有效利用時序信息和社交信息成為重要的研究課題之一。文中通過建模用戶的隱式朋友和項目的社交屬性,提出了一種新穎的基于高階和時序特征的圖神經(jīng)網(wǎng)絡(luò)社會化推薦算法(Graph Neural Networks Social Recommendation Based on High-order and Temporal Features)模型,簡稱HTGSR。HTGSR首先利用門控遞歸單元對基于項目的用戶表征進行建模,以反映用戶的近期動態(tài)偏好,并定義一個高階建模單元來提取用戶的高階連通特征,挖掘用戶的隱式朋友信息;其次利用注意力機制獲取基于社交關(guān)系的用戶表征;然后提出不同的項目社交網(wǎng)絡(luò)的構(gòu)建方式,并利用注意力機制來獲取項目表征;最后將用戶和項目的潛在表征輸入到多層感知機,完成用戶對項目的評分預(yù)測。在兩個數(shù)據(jù)集上進行詳細的實驗,并將實驗結(jié)果與多種類型的推薦算法進行比較,結(jié)果表明HTGSR模型在兩個數(shù)據(jù)集上的效果均較優(yōu)。
引用本文:于健, 趙滿坤, 高潔, 王聰源, 李亞蓉, 張文彬. 基于高階和時序特征的圖神經(jīng)網(wǎng)絡(luò)社會化推薦算法研究[J]. 計算機科學(xué), 2023, 50(3): 49-64.
掃碼閱讀全文
一種靜態(tài)分析與知識圖譜結(jié)合的Java冗余代碼檢測方法
劉昕煒 陶傳奇
摘要: 冗余代碼普遍存在于商業(yè)和開源軟件中,它的存在可能會增加內(nèi)存占用,影響代碼可維護性,增加維護成本??焖兕愋头治鏊惴ㄊ钱?dāng)前Java冗余代碼檢測中常用的靜態(tài)分析方法,該算法在虛方法分析方面還存在一些不足。XTA是一種調(diào)用圖構(gòu)造算法,在處理虛方法的調(diào)用方面具有較高的精度和效率。文中提出了一種基于XTA調(diào)用圖構(gòu)建算法的方法來檢測Java代碼中的冗余代碼,在一個名為“RCD”(Redundant Code Detection)的工具原型中實現(xiàn)了這種方法,并通過構(gòu)建知識圖譜輔助人工審查,以提高人工審查的效率以及冗余代碼檢測的可信度。通過在4個開源Java應(yīng)用程序上的實驗對RCD與其他3個冗余代碼檢測工具進行了比較。實驗結(jié)果表明,RCD在檢測冗余代碼的準(zhǔn)確性方面相比其他工具提高了1%~30%,同時在檢測冗余虛方法的完整性方面提升了4%左右。
引用本文:劉昕煒, 陶傳奇. 一種靜態(tài)分析與知識圖譜結(jié)合的Java冗余代碼檢測方法[J]. 計算機科學(xué), 2023, 50(3): 65-71.
掃碼閱讀全文
細粒度語義知識圖譜增強的中文OOV詞嵌入學(xué)習(xí)
陳姝睿 梁子然 饒洋輝
摘要: 隨著信息化領(lǐng)域的范圍不斷擴大,許多特定領(lǐng)域的文本語料開始涌現(xiàn)。這些特定領(lǐng)域,如醫(yī)療、通信等,由于受到安全性和敏感性的影響,其數(shù)據(jù)規(guī)模通常較小,傳統(tǒng)的詞嵌入學(xué)習(xí)模型難以獲得有效的結(jié)果。另一方面,直接應(yīng)用現(xiàn)有的預(yù)訓(xùn)練語言模型時會出現(xiàn)較多未登錄詞,這些詞匯無法表示成向量,從而影響下游任務(wù)的性能表現(xiàn)。許多學(xué)者開始研究如何利用細粒度語義信息來得到較高質(zhì)量的未登錄詞向量表示。然而,當(dāng)前的未登錄詞嵌入學(xué)習(xí)模型大多針對英文語料,對中文詞的細粒度語義信息只能進行簡單的拼接或映射,難以在中文未登錄詞嵌入學(xué)習(xí)任務(wù)中得到有效的向量表示。針對上述問題,首先通過中文構(gòu)字規(guī)則,即中文詞所包含的漢字、漢字所包含的部件和拼音等,構(gòu)建細粒度的知識圖譜,使其不僅能涵蓋漢字和單詞之間的關(guān)聯(lián)關(guān)系,還能對拼音和漢字、組件和漢字等細粒度語義信息之間的多元且復(fù)雜的關(guān)聯(lián)關(guān)系進行表征。然后,在知識圖譜上運行圖卷積算法,從而對中文詞的細粒度語義信息之間以及它們與詞語義之間更深層次的關(guān)系進行建模。此外,文中通過在子圖結(jié)構(gòu)上構(gòu)建圖讀出來進一步挖掘細粒度語義信息與詞語義信息之間的組成關(guān)系,據(jù)此提升模型在未登錄詞嵌入推斷中的精準(zhǔn)度。實驗結(jié)果表明,在面對未登錄詞占比較大的特定語料上的詞配對、詞相似任務(wù),以及文本分類、命名實體識別等下游任務(wù)時,所提模型都取得了更好的性能。
引用本文:陳姝睿, 梁子然, 饒洋輝. 細粒度語義知識圖譜增強的中文OOV詞嵌入學(xué)習(xí)[J]. 計算機科學(xué), 2023, 50(3): 72-82.
掃碼閱讀全文
醫(yī)學(xué)知識圖譜研究與應(yīng)用綜述
蔣川宇 韓翔宇 楊文蕊 呂博涵 黃小歐 謝夏 谷陽
摘要: 醫(yī)學(xué)數(shù)據(jù)數(shù)字化推進過程中,如何選擇合適的技術(shù)來對醫(yī)學(xué)數(shù)據(jù)進行高效處理和準(zhǔn)確分析,是當(dāng)今醫(yī)學(xué)領(lǐng)域普遍面臨的問題。利用具有優(yōu)秀聯(lián)想與推理能力的知識圖譜技術(shù)來對醫(yī)學(xué)數(shù)據(jù)進行處理與分析,能更好地實現(xiàn)智慧醫(yī)療、輔助診斷等應(yīng)用。醫(yī)學(xué)知識圖譜的完整構(gòu)建過程包括知識抽取、知識融合和知識推理。其中知識抽取可細分為實體抽取、關(guān)系抽取和屬性抽取,知識融合則主要包括實體對齊和實體消歧。首先,對現(xiàn)今醫(yī)學(xué)知識圖譜的構(gòu)建技術(shù)和實際應(yīng)用進行歸納整理,針對每一具體構(gòu)建過程闡明技術(shù)發(fā)展脈絡(luò)。在此基礎(chǔ)上,對相關(guān)技術(shù)進行介紹并說明其優(yōu)點和局限性。其次,介紹幾個已成熟運用的醫(yī)學(xué)知識圖譜。最后,根據(jù)知識圖譜在醫(yī)學(xué)領(lǐng)域的技術(shù)與應(yīng)用現(xiàn)狀,給出未來知識圖譜可進行的技術(shù)兼應(yīng)用性的研究方向。
引用本文:蔣川宇, 韓翔宇, 楊文蕊, 呂博涵, 黃小歐, 謝夏, 谷陽. 醫(yī)學(xué)知識圖譜研究與應(yīng)用綜述[J]. 計算機科學(xué), 2023, 50(3): 83-93.
掃碼閱讀全文
基于表示學(xué)習(xí)的知識圖譜推理研究綜述
李志飛 趙月 張龑
摘要: 知識圖譜以結(jié)構(gòu)化形式描述了現(xiàn)實世界中的客觀知識,但面臨著構(gòu)建不完整或者無法處理新增知識等挑戰(zhàn)。知識圖譜推理方法成為了知識圖譜補全和更新的重要手段,該方法旨在基于圖譜中已有的事實推斷出未知的事實。近年來,基于表示學(xué)習(xí)的知識圖譜推理研究受到了廣泛關(guān)注,其主要研究思路是將實體和關(guān)系嵌入到低維連續(xù)向量空間從而進行推理,具有計算效率快、推理性能高等優(yōu)勢。文中以基于表示學(xué)習(xí)的知識圖譜推理方法為研究對象,首先對相關(guān)的符號表示、數(shù)據(jù)集、評價指標(biāo)、訓(xùn)練方法以及評測任務(wù)進行了簡要概述;其次介紹了基于平移距離和語義匹配的兩種典型知識圖譜推理方法;然后對融合多源信息的推理方法進行了分類和梳理,以及詳細分析了近期流行的基于神經(jīng)網(wǎng)絡(luò)的推理研究進展;最后總結(jié)全文,同時對知識圖譜推理的未來研究方向進行展望。
引用本文:李志飛, 趙月, 張龑. 基于表示學(xué)習(xí)的知識圖譜推理研究綜述[J]. 計算機科學(xué), 2023, 50(3): 94-113.
掃碼閱讀全文
THE END
轉(zhuǎn)自:計算機科學(xué)編輯部微信公眾號文章
評論 0