近日,CCF A類人工智能國際頂級會議AAAI'2024放榜,團隊與澳大利亞莫納什大學、中山大學等單位合作,以暨南大學為通訊作者單位或第一作者單位被人工智能國際頂級會議(CCF A)AAAI 2024接收。本次會議上發(fā)表的2篇論文涉及分布外泛化模型、作文自動評分模型等研究領域。本次會議共提交了12100篇文章,接受了2342篇論文,總體錄用率為23.75%。
AAAI的英文全稱是The Association for the Advancement of Artificial Intelligence,即人工智能促進協(xié)會,該協(xié)會主辦的年會 (The AAAI Conference on Artificial Intelligence) 是重要的國際人工智能學術會議之一,致力于推動智能思維與行為機制的科學理解及機器實現(xiàn),并促進人工智能的科學研究和規(guī)范應用,對于人工智能領域的學術研究有著顯著的影響力和知名度。許多重要的理論突破、創(chuàng)新方法和實際應用都在該會議上首次亮相,屬于CCF-A類會議。第38屆AAAI會議(AAAI-24)將于2024年2月20日至27日在加拿大溫哥華舉行。
論文1:Diagnosing and Rectifying Fake OOD Invariance: A Restructured Causal Approach
中文:分布外泛化中偽不變性的診斷與修正:一種重構因果方法
作者:陳子良,Yongsen Zheng ,賴兆榮, 官全龍*, 林倞
不變表征學習通過構建不變特征到標簽之間的因果關系去排除領域環(huán)境中的混淆因子,從而賦予智能體在面對訓練分布外數(shù)據(jù)時的泛化能力。盡管這類方法備受關注,最近理論研究發(fā)現(xiàn)通過不變表征學習重構出來的一部分因果特征往往只是“假裝”具有領域不變性:其領域不變性只體現(xiàn)在參與訓練的領域中,而當遇上沒見過的領域數(shù)據(jù)時,這些特征下的標簽預測效果往往不具備領域不變的特點。該類偽不變特性嚴重威脅到現(xiàn)有不變表征學習模型的分布外泛化能力。而在本工作中,基于部分信息不變特征結構因果模型(PIIF SCM)及完全信息不變特征結構因果模型(FIIF SCM)的常見數(shù)據(jù)假設下,我們重新審視了一系列關于不變表征學習方法。我們對基于信息不變特征結構因果模型和完全信息不變特征結構因果模型的領域數(shù)據(jù)假設提供了新的理論分析,發(fā)現(xiàn)其兩者均無法同時對虛假特征(spurious features)和偽不變特征(fake invariant features)進行有效建模。因此,我們聯(lián)合以上兩個結構因果模型的因果圖提出了重構結構因果模型(RS-SCM),實現(xiàn)了對數(shù)據(jù)背后的虛假特征和偽不變特征的同時建模;并且通過對RS-SCM中的變量因果關系進行分析,進一步提出了交互不變學習方法。交互不變學習通過引入一個小型的輔助網(wǎng)絡對現(xiàn)有的不變表征學習方法實現(xiàn)改造,利用條件互信息去交互消除虛假特征和偽不變特征對分布外標簽預測效果的干擾。診斷性實驗進一步證實了理論假設和方法的可信性,同時真實的大規(guī)模領域泛化基準數(shù)據(jù)也驗證了提出方法的有效性。
論文2:Unveiling the Tapestry of Automated Essay Scoring: A Comprehensive Investigation of Accuracy, Fairness, and Generalizability
中文:揭開作文自動評分模型的面紗:對準確性、公平性和普遍性的綜合研究
作者:Kaixun Yang , Mladen Rakovic , Yuyang Li , Quanlong Guan(官全龍)*, Dragan Gasevic , Guanliang Chen*
作文自動評分(AES)模型是一種公認的智慧教育追求和人工智能+教育的典型應用,它采用機器學習來評估學生撰寫的作文。鑒于目前機器學習模型存在固有的偏見及對邊緣化群體有著潛在影響,研究當前AES模型中是否存在這種非公平性的偏見,這種偏見如何發(fā)現(xiàn)及影響AES模型的準確性和泛化性。因此,我們的研究旨在揭示AES模型的準確性、公平性和泛化性之間的復雜關系,為在現(xiàn)實世界的智慧教育中開發(fā)有效的AES模型提供實用見解。為此,我們精心選擇了九種先進的AES方法,并在開源數(shù)據(jù)集上使用七種不同的指標評估了它們的性能,該數(shù)據(jù)集包含25000多篇文章和關于學生的各種人口統(tǒng)計信息,如性別、英語學習者狀況和經(jīng)濟狀況。通過廣泛的評估,我們得出非常有趣的結論:在預測準確性方面,特定提示模型往往優(yōu)于跨提示模型;與跨提示模型相比,特定提示模型往往對不同經(jīng)濟地位的學生表現(xiàn)出更大的偏見; 在追求泛化性的過程中,與復雜的神經(jīng)網(wǎng)絡模型相比,傳統(tǒng)的機器學習模型(如SVM)與精心設計的特征相結合,在實現(xiàn)高精度和公平性方面具有更大的潛力。
研究工作得到了國家重點研發(fā)計劃(2022YFC3303603),國家自然科學基金(62077028, 62377028),粵港澳智慧教育聯(lián)合重點實驗室(2022LSYS003)等項目的支持。