全球知名人工智能科學家朱松純及團隊全新成果、國內(nèi)首本通用人工智能測評書《通用人工智能標準、評級、測試與架構(gòu)》于2025年4月面市,這本書提出了通用人工智能的中國標準!
通用人工智能(Artificial General Intelligence,AGI)的研究目標是尋求統(tǒng)一的理論框架來解釋各種智能現(xiàn)象,并研發(fā)具有高效的學習和泛化能力,能夠根據(jù)所處的復(fù)雜動態(tài)環(huán)境自主定義、生成并完成任務(wù)的通用智能體,使其具備自主的感知、認知、決策、學習、執(zhí)行和社會協(xié)作等能力,且符合人類的情感、倫理與道德觀念。
大語言模型(Large Language Model,LLM)技術(shù)應(yīng)用在當前市場上一片火熱,業(yè)界眾多老板和技術(shù)人已經(jīng)在憧憬,大模型將會引領(lǐng) AI 走向通用人工智能。
但現(xiàn)實很可能要對這個觀點澆上一盆冷水:大模型還不能算是通用人工智能。甚至這個方向也許都走不通,這是為何?
只能做特定的、人類事先定義好的任務(wù);
每項任務(wù)都需要大量的數(shù)據(jù)與標注,以及與計算相關(guān)的高額能量和資源;
模型不可解釋、知識表達不能交流;
大數(shù)據(jù)獲取與計算的成本昂貴。
本質(zhì)上,當前被社會所廣泛認知的大模型大多是這樣一種“以大數(shù)據(jù)驅(qū)動小任務(wù)工作”的范式,而認知人工智能提出了依賴少量數(shù)據(jù)實現(xiàn)對問題的理解、分析、推理與決策,執(zhí)行可以延伸、泛化的“大任務(wù)”的發(fā)展方向。
世界級人工智能專家朱松純教授對 AGI 進行了諸多開創(chuàng)性的研究,提出了一整套關(guān)于 AGI 如何評價、測試、構(gòu)建的理論框架。
他有個很形象的比喻,大模型的“大數(shù)據(jù),小任務(wù)”范式就像鸚鵡學舌,會說人話但其實不解人意;AGI 的“小數(shù)據(jù),大任務(wù)”范式應(yīng)該像烏鴉能夠?qū)W會某種常識并巧妙地利用常識解決新的問題。

所以,相比“鸚鵡范式”,“烏鴉范式”才是通往 AGI 的更有效路徑。
朱松純教授領(lǐng)銜編著了《通用人工智能標準、評級、測試與架構(gòu)》這本書,從哲學層面思考 AGI 到底是什么、應(yīng)該是什么樣的,并給出了可靠的評級與測試方法。
要想推動通用人工智能實現(xiàn)落地,首先要提出一套統(tǒng)一的理論架構(gòu),然后在此基礎(chǔ)上研發(fā)具有泛化與學習能力,自主定義任務(wù)并將其完成的通用智能體。
書中將這套理論框架總結(jié)為“一個定義、兩個完備性、三個基本特征、八個關(guān)鍵問題”,它們包含以下內(nèi)容:
一個定義:AGI能夠在價值空間與能力空間體系下進行自主學習、完成任務(wù),最大化其價值,同時具備一定價值“進化”能力的個體。
兩個完備性: 認知架構(gòu)完備性與測試環(huán)境完備性。
三個基本特征: 1. 無限任務(wù),對于通用智能體而已言,需要能夠勝任所處環(huán)境形成的任務(wù)空間中的無限任務(wù)。2. 自主生成任務(wù),能夠根據(jù)自身的動機去判斷下一步做什么和自主地生成任務(wù),并從真實生活場景中觀察、體驗和獲取人類反饋,進而不斷地積累經(jīng)驗、形成認知,最終能夠處理各種隨機情況;3. 價值驅(qū)動,通過人類反饋和交互式學習,AGI 將與人類價值觀實現(xiàn)對齊。
八個問題: 認知架構(gòu)、自我意識、社會智能、價值驅(qū)動、價值習得、具身智能、可解釋性,以及人機互信。
首先,大模型缺乏自主生成新任務(wù)的能力;其次,大模型與人類的價值對齊是脆弱和僵硬的,難以實現(xiàn)價值驅(qū)動;最后,大模型在具身智能方面的進展仍然有限。
厘清了 AGI 的根本性問題,我們才有可能找到正確的答案。
帶領(lǐng)我們?nèi)ヌ剿?AGI 終極答案的,是我國一流的新型研發(fā)機構(gòu)——北京通用人工智能研究院,朱松純教授正是通研院院長,在他的引領(lǐng)下,凝聚了數(shù)百人四年攻關(guān)的成果,寫出了這本《通用人工智能標準、評級、測試與架構(gòu)》。

朱松純 1991 年畢業(yè)于中國科學技術(shù)大學計算機專業(yè),后赴美留學,他長期致力于構(gòu)建計算機視覺、認知科學乃至人工智能科學的統(tǒng)一數(shù)理框架。
曾三次問鼎計算機視覺領(lǐng)域國際最高獎項——馬爾獎,兩次擔任國際計算機視覺與模式識別大會(CVPR)主席。
在美國工作生活 28 年后,朱松純教授于 2020 年 9 月毅然全職回國,擔任北京大學人工智能研究院院長、智能學院院長,清華大學與北京大學講席教授等職。
在北京市、科技部、教育部的大力支持下,朱教授組建北京通用人工智能研究院,并獲批國家重點實驗室——國家戰(zhàn)略科學家。
通研院的使命是探索涵蓋人工智能六大核心領(lǐng)域的統(tǒng)一理論與認知架構(gòu)構(gòu)建大任務(wù)訓練與測試平臺,在個人與社會兩個時空尺度實現(xiàn)物理和社會逼真的大型仿真系統(tǒng)。這對于提升我國在 AI 科技領(lǐng)域的競爭力具有重大意義。

截至目前,學術(shù)界對于 AGI 還沒有統(tǒng)一的定義,國際上也缺乏通用人工智能測試評級標準與平臺。
因此本書嘗試提出一套標準化的通用人工智能測試與評級體系。根據(jù)書中內(nèi)容,可以分為五個部分,我們一步一步來學習它。
第一步:通用人工智能的定義與特征
首先,書中回顧了人工智能的發(fā)展歷史,剖析對比了“大數(shù)據(jù),小任務(wù)”與“小數(shù)據(jù),大任務(wù)”兩種范式。
然后詳細探討了智能體的心智空間,并提供了 價值空間(簡稱V空間)和 能力空間(簡稱U空間)的數(shù)學定義、迭代與演化,以及通用人工智能的停機問題與學習極限問題。

隨后闡述了通用人工智能的兩個完備性認知架構(gòu)完備性與測試環(huán)境完備性,三個基本特征無限任務(wù)、自主生成任務(wù)、價值驅(qū)動,以及 8 個關(guān)鍵問題。
通過這一系列的討論,讀者將能夠掌握通用人工智能的核心概念和關(guān)鍵特征。
第二步:測試與評級
在這一步,書中先是回顧了經(jīng)典人工智能測評方法與局限性,然后提出了新型測試體系。
再詳細介紹了通智測試的整體設(shè)計思路、動態(tài)具身物理社會交互環(huán)境的構(gòu)建,以及無限任務(wù)生成系統(tǒng)的概念。

對基于能力與價值雙系統(tǒng)的評級框架進行深入探討,為評估和理解通用人工智能的能力提供了標準化的方法。
第三步:訓練與測試平臺
這一步聚焦于通用人工智能的訓練與測試平臺,介紹了測試環(huán)境完備性的實現(xiàn)、具身智能體仿真平臺的現(xiàn)狀與挑戰(zhàn),并提出了搭建通用人工智能訓練與測試平臺的方案。

書中對機器人仿真和虛擬人仿真進行深入探討,包括自主生成無限場景、具身機器人的交互任務(wù)、自然語言交互、虛擬現(xiàn)實交互等,提供了一個全面的通用人工智能測試與訓練平臺的視角。
第四步:TongAI理論框架
本書提出了 TongAI 理論框架,這是通用人工智能的一種實現(xiàn)途徑。
本書提出,應(yīng)將“為機器立心”作為通用人工智能的關(guān)鍵路徑,TongAI理論框架的核心包括3要素:以價值為驅(qū)動的認知架構(gòu)、與人相合的價值體系、通信式學習。

這一步揭示了如何構(gòu)建一個具有認知和價值判斷能力的通用人工智能系統(tǒng),為實現(xiàn)真正的 AGI 提供了理論基礎(chǔ)和實踐指導(dǎo)。
第五步:AGI 發(fā)展建議
最后一步提供了對發(fā)展通用人工智能的建議。書中討論了通用人工智能發(fā)展對人類和社會的影響,包括智能時代的風險挑戰(zhàn)使命。
書中還提出了加速布局通用人工智能研究的策略有組織科研的實踐,以及智能社會治理的探索。
《通用人工智能標準、評級、測試與架構(gòu)》是一部集系統(tǒng)性、理論深度與前瞻性于一體的著作,為讀者提供了一個關(guān)于通用人工智能的學習實踐指南。
本書的一大特點是提出了一個全面的理論框架,包括“一個定義、兩個完備性、三個基本特征、八個關(guān)鍵問題”。為通用人工智能的研究提供了系統(tǒng)的理論指導(dǎo)。對測試環(huán)境和訓練平臺的詳細論述,則為讀者提供了易驗證的實驗方法。

書中不僅涵蓋了心理學、哲學、計算機科學等多個學科的研究成果,還提出了基于“能力與價值雙系統(tǒng)”的理論框架,展現(xiàn)了跨學科視角的廣度與深度。
本書極具前瞻性,包括對通用人工智能未來發(fā)展的深刻洞察,以及對智能時代風險與挑戰(zhàn)的科學分析。
在倫理和社會責任方面,本書特別強調(diào)了在發(fā)展通用人工智能時必須考慮的倫理道德問題,以及構(gòu)建人機共生新文明的重要性。
這些內(nèi)容不僅為技術(shù)專家提供了指導(dǎo),也為政策制定者和社會學者提供了寶貴的思考。

科技領(lǐng)域的管理者、投資者、專業(yè)研究人員,以及對發(fā)展通用人工智能感興趣的大眾讀者,都能從本書中獲得寶貴的知識和啟發(fā)。
評論 0