實驗室于2025年6月3日于計算機(jī)學(xué)院231會議室召開2025年第5期SCHOLAT數(shù)智論壇暨實驗室組會,會議由湯庸老師擔(dān)任主持人,實驗室內(nèi)15名學(xué)生做匯報。
首先由林喜佳同學(xué)做《基于社交網(wǎng)絡(luò)的圖神經(jīng)網(wǎng)絡(luò)推薦系統(tǒng)研究》內(nèi)容的報告。匯報指出社交推薦通過利用社交關(guān)聯(lián)增強個性化推薦效果,但受無關(guān)或虛假社交關(guān)系影響,推薦準(zhǔn)確性受損。為此,提出基于擴(kuò)散模型的社交去噪推薦框架RecDiff,通過圖擴(kuò)散處理與對比學(xué)習(xí),提升推薦的準(zhǔn)確性和可靠性。
圖1 林喜佳同學(xué)做《基于社交網(wǎng)絡(luò)的圖神經(jīng)網(wǎng)絡(luò)推薦系統(tǒng)研究》內(nèi)容的報告
第二項報告是王怡嘉同學(xué)的《基于社交網(wǎng)絡(luò)的學(xué)者影響力最大化研究》。匯報中提到,隨著學(xué)術(shù)社交平臺的普及,學(xué)者間的合作、引用與推薦行為形成了復(fù)雜的學(xué)術(shù)社交網(wǎng)絡(luò),影響知識傳播與資源分配。學(xué)者影響力是評估其學(xué)術(shù)地位與科研價值的重要依據(jù),精準(zhǔn)建模和最大化研究具有重要意義。王怡嘉同學(xué)的匯報內(nèi)容包括基于先驗增強的自適應(yīng)圖嵌入與強化學(xué)習(xí)的影響力最大化方法,以及在不同擴(kuò)散模式下對不同方法的性能比較。此外,匯報中還探討了整合學(xué)者的H指數(shù)、科研成果數(shù)量、被引次數(shù)等多維數(shù)據(jù)的可能性,與社交網(wǎng)絡(luò)影響力最大化模型相結(jié)合,深入分析學(xué)者的影響力。
圖2 王怡嘉同學(xué)做《基于社交網(wǎng)絡(luò)的學(xué)者影響力最大化研究》內(nèi)容的報告
第三項報告是鐘志杰同學(xué)的《論文工作與進(jìn)展》。主要介紹了一種使用對比學(xué)習(xí)方法對圖數(shù)據(jù)進(jìn)行擾動的框架,包括基于LLM的節(jié)點文本屬性增強、節(jié)點刪除、邊的刪除和增加等操作,并對相關(guān)數(shù)據(jù)集進(jìn)行了介紹和實驗驗證。鐘志杰同學(xué)計劃繼續(xù)完善實驗并撰寫論文。
圖3 鐘志杰同學(xué)做《論文工作與進(jìn)展》內(nèi)容的報告
第四項報告是張路明同學(xué)的《基于動態(tài)學(xué)術(shù)社交網(wǎng)絡(luò)的推薦系統(tǒng)研究》。研究目的是構(gòu)建一個精準(zhǔn)的推薦系統(tǒng),以應(yīng)對學(xué)術(shù)信息平臺中存在的問題,比如學(xué)者難以全面掌握學(xué)術(shù)領(lǐng)域的最新動態(tài)和潛在合作對象。報告中提到了各種推薦方法,包括基于內(nèi)容的、基于結(jié)構(gòu)的和基于圖神經(jīng)網(wǎng)絡(luò)的推薦方法,還提出了一個名為ATSPN的動態(tài)圖神經(jīng)網(wǎng)絡(luò)模型,這個模型具有自適應(yīng)剪枝策略和結(jié)構(gòu)感知時序編碼器,旨在消除冗余邊的影響,提升推薦的準(zhǔn)確性。最后,張路明同學(xué)總結(jié)了研究成果,并展望了未來將這些方法應(yīng)用到學(xué)者智庫推薦系統(tǒng)中的潛力。
圖4 張路明同學(xué)做《基于動態(tài)學(xué)術(shù)社交網(wǎng)絡(luò)的推薦系統(tǒng)研究》內(nèi)容的報告
第五項報告是方文李同學(xué)的《基于爬蟲的學(xué)者數(shù)據(jù)更新》。之前團(tuán)隊爬取了若干學(xué)校學(xué)者主頁,數(shù)據(jù)庫保存有24000余條學(xué)者信息,但數(shù)據(jù)自保存后未更新過,因此需要建立持續(xù)更新機(jī)制。學(xué)者個人主頁分為兩類,一類可直接獲取內(nèi)容,目前已編寫單線程腳本更新數(shù)據(jù);另一類需多次加載,暫時未解決。對于需多次加載的情況,方文李同學(xué)后續(xù)設(shè)想獲取各url和xhr地址,分別請求后合并結(jié)果再處理。
圖5 方文李同學(xué)做《基于爬蟲的學(xué)者數(shù)據(jù)更新》內(nèi)容的報告
第六項報告是紀(jì)少杰同學(xué)的《學(xué)者畫像》。紀(jì)少杰同學(xué)對智能問答界面進(jìn)行了功能增強,引入學(xué)者畫像側(cè)邊欄?;?/span>AI回復(fù)內(nèi)容,系統(tǒng)將智能匹配并自動呈現(xiàn)關(guān)聯(lián)學(xué)者的深度畫像。用戶可直觀探索其頭銜詞云、研究熱力圖及學(xué)術(shù)生涯時間軸,全面洞察學(xué)者專長、貢獻(xiàn)與發(fā)展軌跡。該側(cè)邊欄支持靈活切換,使用戶在獲取信息的同時,獲得更全面、可視化的知識探索體驗。
圖6 紀(jì)少杰同學(xué)做《學(xué)者畫像》內(nèi)容的報告
第七項報告是梁藝霖同學(xué)《學(xué)者智庫數(shù)據(jù)可視化》。學(xué)者智庫爬取了全國985、211計算機(jī)院系高校學(xué)者的學(xué)者主頁信息,要挖掘數(shù)據(jù)的價值首先要進(jìn)行可視化分析,而我針對學(xué)者信息設(shè)計了9款可視化工具。第一種是學(xué)者名片,展示了學(xué)者的基礎(chǔ)信息包括姓名、職稱、個人簡介等,在頭像右側(cè)設(shè)計了對學(xué)者成果的研究領(lǐng)域分析條形圖。第二種是學(xué)術(shù)關(guān)系知識圖譜,用于探索研究領(lǐng)域、學(xué)者與論文之間的關(guān)聯(lián)網(wǎng)絡(luò)。第三種是學(xué)術(shù)影響力趨勢分析,展示近十年論文發(fā)表量、H指數(shù)與被引用次數(shù)變化趨勢。第四種是學(xué)術(shù)影響力輻射地圖,展示學(xué)者合作機(jī)構(gòu)、發(fā)表論文等所在地區(qū)。第五種是學(xué)術(shù)多維評價儀表盤,展示幾個核心評估指標(biāo)。第六種是滾動展示學(xué)者最新發(fā)表的研究論文與成果。第七種是用雷達(dá)圖和柱狀圖展示成果類型分布和數(shù)量。第八種是基于歷史數(shù)據(jù)的趨勢預(yù)測與生存分析。第九種是學(xué)者對比分析工具。
圖7 梁藝霖同學(xué)做《學(xué)者智庫數(shù)據(jù)可視化》內(nèi)容的報告
羅世權(quán)碩士匯報了《基于neo4j的學(xué)者與論文節(jié)點影響力計算方法》,其工作在Neo4j中構(gòu)建了以學(xué)者為中心的學(xué)術(shù)成果網(wǎng)絡(luò)的基礎(chǔ)上,通過設(shè)計讓影響力從期刊和會議-論文,學(xué)者的路線,進(jìn)一步設(shè)計了學(xué)者與論文節(jié)點的影響力算法,提升了學(xué)者推薦的精確度。其算法具備了可擴(kuò)展性,加權(quán)組合多因素考量,動態(tài)傳播等多個優(yōu)點。
圖8 羅世權(quán)碩士匯報《基于neo4j的學(xué)者與論文節(jié)點影響力計算方法》
田浩碩士匯報了《知識圖譜數(shù)據(jù)維護(hù)》,報告了自己當(dāng)前數(shù)據(jù)維護(hù)的工作對于編碼亂碼,非法 URL ,HTML 冗余,字段不統(tǒng)一,空值混亂等問題的處理。以及定期數(shù)據(jù)清洗的日程安排邏輯,表示該任務(wù)應(yīng)層層遞進(jìn),以確保數(shù)據(jù)質(zhì)量和系統(tǒng)架構(gòu)持續(xù)優(yōu)化。
圖9 田浩碩士匯報《知識圖譜數(shù)據(jù)維護(hù)》
唐雙姣碩士匯報了《基于學(xué)者網(wǎng)數(shù)據(jù)的學(xué)術(shù)社交網(wǎng)絡(luò)特征分析》,從學(xué)者維度驗證了弱聯(lián)系在跨圈層信息傳播中的橋梁作用。同時,從學(xué)術(shù)產(chǎn)出數(shù)據(jù)分得出學(xué)者網(wǎng)具有明顯的馬太效應(yīng),最后,在學(xué)訊維度,平臺信息生態(tài)正從“用戶主導(dǎo)的社交傳播”向“機(jī)構(gòu)驅(qū)動的結(jié)構(gòu)發(fā)布”演化。不同賬號來源在內(nèi)容主題、傳播周期與沉淀價值上表現(xiàn)出系統(tǒng)性差異,構(gòu)成“即時發(fā)布—長尾擴(kuò)散”的互補機(jī)制。總而言之,學(xué)者網(wǎng)社交圖呈現(xiàn)明顯的“小世界 + 無標(biāo)度”結(jié)構(gòu)特征,信息在整體上具備高效擴(kuò)散能力,且少數(shù)高連接度用戶在結(jié)構(gòu)中占據(jù)核心地位。
圖10 唐雙姣碩士匯報《基于學(xué)者網(wǎng)數(shù)據(jù)的學(xué)術(shù)社交網(wǎng)絡(luò)特征分析》
姚潤彬碩士匯報了《基于高校智庫的學(xué)者信息可視化》,利用智庫高校學(xué)者數(shù)據(jù),實現(xiàn)了學(xué)者信息可視化,完成了個人信息展示,學(xué)術(shù)研究陳列,研究方向展示,相關(guān)學(xué)者推薦等多個模塊的實現(xiàn),并兼容中英兩個版本。
圖11 姚潤彬碩士匯報《基于高校智庫的學(xué)者信息可視化》
鄭政碩士匯報了《學(xué)者網(wǎng)數(shù)據(jù)安全匯報》,闡釋了數(shù)據(jù)保護(hù)的重要性,分析了學(xué)者網(wǎng)可能涉及的數(shù)據(jù)安全問題如XSS攻擊,敏感數(shù)據(jù)處理,Doss攻擊,線程安全問題,數(shù)據(jù)備份和恢復(fù),數(shù)據(jù)操作的監(jiān)控以及其應(yīng)對措施。
圖12 鄭政碩士匯報《學(xué)者網(wǎng)數(shù)據(jù)安全匯報》
盧泓鋼學(xué)士匯報了《基于學(xué)者網(wǎng)搜索日志的信息可視化》,從搜索次數(shù),搜索設(shè)備,搜索類別,搜索內(nèi)容四個維度分析了學(xué)者網(wǎng)的用戶訪問數(shù)據(jù),得出學(xué)者網(wǎng)用戶主要以pc端訪問為主,主要搜索學(xué)者用戶和學(xué)者動態(tài)的結(jié)論,其中搜索的主要關(guān)鍵詞為國際會議,機(jī)器學(xué)習(xí),期刊征稿和廣東若干大學(xué)名稱。
圖13 盧泓鋼學(xué)士匯報《基于學(xué)者網(wǎng)搜索日志的信息可視化》
梁永燊學(xué)士匯報了《學(xué)術(shù)信息采集工具的開發(fā)進(jìn)展與展望》,報告了當(dāng)前實現(xiàn)的收集整理期刊、會議的分級信息;針對論文數(shù)據(jù)的多標(biāo)準(zhǔn)分級描述與匹配,并根據(jù)該描述進(jìn)行排序和篩選;學(xué)術(shù)成果數(shù)據(jù)的可選擇性導(dǎo)出;生成學(xué)術(shù)成果數(shù)據(jù)的年份統(tǒng)計圖等工作進(jìn)展,最后提出如“簡歷”形式的學(xué)術(shù)成果可視化目標(biāo)。
圖14 梁永燊學(xué)士匯報《學(xué)術(shù)信息采集工具的開發(fā)進(jìn)展與展望》
第十五項報告是李樹鵬同學(xué)的《基于學(xué)者人口統(tǒng)計特征的學(xué)術(shù)表現(xiàn)差異分析——來自身份證信息的實證研究》。研究基于學(xué)者身份證信息,分析人口統(tǒng)計特征與學(xué)術(shù)表現(xiàn)的差異。文件指出國家正通過構(gòu)建適應(yīng)新質(zhì)生產(chǎn)力的科技人才體系解決關(guān)鍵領(lǐng)域人才短缺問題,現(xiàn)有研究存在樣本偏差和縱向追蹤不足,而本研究旨在通過量化學(xué)術(shù)人才分布的結(jié)構(gòu)性矛盾,為學(xué)術(shù)相關(guān)政策制定中的公平性優(yōu)化提供建議,并提出了設(shè)立西部人才專項基金、改革年齡限制性政策等具體建議。研究局限性在于樣本的學(xué)生群體偏多,目前僅處于數(shù)據(jù)分析階段。
圖15 李樹鵬同學(xué)做《學(xué)者智庫數(shù)據(jù)可視化》內(nèi)容的報告
湯老師在總結(jié)中提出了重要指導(dǎo)。首先,他強調(diào)研究要以問題驅(qū)動,聚焦具有科學(xué)價值的核心挑戰(zhàn),避免低效重復(fù)。其次,他鼓勵同學(xué)們在研究中追求創(chuàng)新與突破,力爭產(chǎn)出具有影響力的成果。最后,他提出要推動科研成果轉(zhuǎn)化,加強產(chǎn)學(xué)研結(jié)合,讓研究真正服務(wù)于實際應(yīng)用。此次會議為實驗室成員明確了方向,激勵大家在學(xué)術(shù)研究和實踐應(yīng)用中取得更大進(jìn)展。
編輯:李若琳,魏玲玲,陳映欣
審核:陳映欣