91一级特黄大片|婷婷中文字幕在线|av成人无码国产|日韩无码一二三区|久久不射强奸视频|九九九久久久精品|国产免费浮力限制

0
點贊
0
評論
0
轉(zhuǎn)載
我要入駐

實驗室1篇文章被ICLR’24錄用

收錄于合集: # 快訊

近期,實驗室與MSRA合作的論文“DENEVIL: TOWARDS DECIPHERING AND NAVIGATING THE ETHICAL VALUES OF LARGE LANGUAGE MODELS VIA INSTRUCTION LEARNING”被國際學(xué)術(shù)會議ICLR’24錄用。該文提出了一個可以動態(tài)評估大語言模型價值觀的評估框架DeNEVIL。DeNEVIL通過迭代式的生成,誘導(dǎo)大語言模型生成違反特定價值觀的提示?;诘赖禄A(chǔ)理論(Moral Foundation Theory),論文利用DeNEVIL算法構(gòu)建了Moral Prompt價值觀評估數(shù)據(jù)集,然后測試了27個主流的大語言模型,發(fā)現(xiàn)了語言模型與人類價值觀的不一致性。而后探索了基于上下文對齊的方式,嘗試對大語言模型進行了對齊。

ICLR是全球機器學(xué)習領(lǐng)域的頂級學(xué)術(shù)會議之一,享有很高的學(xué)術(shù)聲譽。本屆ICLR一共投稿7304篇,錄用論文2250篇,錄用率為31%。

 


復(fù)旦大學(xué)計算與智能創(chuàng)新學(xué)院協(xié)同信息與系統(tǒng)(CISL)實驗室;復(fù)旦大學(xué)社會計算研究中心
返回頂部