在人工智能進入“大模型賦能、場景多元化”新階段的背景下,如何在保證性能的同時降低成本、提升響應(yīng)速度與安全性,成為學(xué)術(shù)界與產(chǎn)業(yè)界的共同課題。在即將到來的中國計算機大會(CNCC 2025)中,北京師范大學(xué)王田教授團隊將攜手多位業(yè)內(nèi)權(quán)威學(xué)者,舉辦“大小模型協(xié)同智能計算”技術(shù)論壇,探索多尺度模型協(xié)同的前沿技術(shù)與落地模式。
一、論壇亮點
與以往單一依賴云端大模型的方式不同,大小模型協(xié)同智能計算強調(diào)云-邊-端一體化融合。大模型憑借深度理解與跨模態(tài)推理能力,在復(fù)雜任務(wù)中表現(xiàn)突出;小模型則以輕量、高效、低延遲為優(yōu)勢,能夠在本地快速響應(yīng)并滿足定制化需求。這種協(xié)同模式不僅有助于緩解高延遲響應(yīng)和高算力消耗問題,還能在隱私保護與合規(guī)治理中發(fā)揮獨特作用。例如,在醫(yī)療影像分析中,端側(cè)小模型可先行預(yù)處理并加密數(shù)據(jù),再由云端大模型進行深度診斷,從而兼顧時效性與安全性。這種協(xié)同計算可以讓大模型和小模型相互配合,各自發(fā)揮所長,實現(xiàn)整體系統(tǒng)的最優(yōu)性能。
二、議題前瞻
本論壇將圍繞以下五個前沿議題展開:
(1)異構(gòu)計算與自主可控架構(gòu):針對大模型依賴高性能計算生態(tài)與自主可控難題,探索面向邊緣與云端的大小模型融合架構(gòu),提升資源利用率與自主安全能力。
(2)跨媒體智能的大小模型協(xié)同:面向多模態(tài)大模型的幻覺、多任務(wù)效率與專用能力不足問題,構(gòu)建大小模型互補的跨媒體智能體系,實現(xiàn)高效、可靠的跨模態(tài)推理與生成。
(3)端側(cè)推理優(yōu)化與智能體構(gòu)建:突破終端設(shè)備算力與能耗瓶頸,發(fā)展面向低延遲、高隱私需求的端側(cè)推理優(yōu)化方法及大語言模型驅(qū)動的終端智能體技術(shù)。
(4)移動端輕量化與端云協(xié)同計算:結(jié)合移動終端的計算與存儲能力提升,發(fā)展輕量化智能推理、分布式聯(lián)合學(xué)習(xí)及端云協(xié)同支撐系統(tǒng),實現(xiàn)廣域高效智能計算。
(5)類腦低功耗通用智能架構(gòu):借鑒大腦信息處理機制,探索樹突脈沖神經(jīng)網(wǎng)絡(luò)等新型架構(gòu),構(gòu)建可替代現(xiàn)有Transformer的低功耗、可擴展類腦通用大模型體系。
三、論壇報告
四、論壇主席
王田,北京師范大學(xué)長聘教授,國家級青年拔尖人才,教育部工程研究中心主任。
王田,北京師范大學(xué)長聘教授,博士生導(dǎo)師,國家級青年拔尖人才,教育部“大數(shù)據(jù)云邊智能協(xié)同”工程研究中心主任,科技部重點研發(fā)項目主持人,廣東普通高校創(chuàng)新團隊帶頭人。香港城市大學(xué)博士,連續(xù)5年入選全球前2%頂尖科學(xué)家終身榜單,入選ScholarGPS前0.05%頂尖科學(xué)家。從事物聯(lián)網(wǎng)、邊緣智能領(lǐng)域的研究工作,在CCF A類以及Transactions系列期刊上發(fā)表論文100余篇。論文被引17000多次,H指數(shù)76,ESI高被引論文10篇(含3篇ESI熱點論文),授權(quán)發(fā)明專利30項(轉(zhuǎn)化2項),主持科技部國家重點研發(fā)計劃1項、國家自然科學(xué)基金5項,獲廣東省科技進步二等獎(排名第一)、福建省自然科學(xué)三等獎(兩次,排名第一)、福建省科技進步二等獎(排名第二)、廣東省計算機學(xué)會青年科技獎(年度唯二)、中國仿真學(xué)會自然科學(xué)一等獎,IEEE/ACM IWQoS 2024 Best Paper Runner-up獎、IEEE CBD 2024 Best Paper獎、IEEE MSN 2024 Best Paper獎、UbiSec 2024 Best Paper獎、BlockSys 2025 Best Paper獎。
五、論壇講者
(1)陳俊龍,華南理工大學(xué)特聘講席教授,計算機科學(xué)與工程學(xué)院院長,廣東省人工智能產(chǎn)業(yè)協(xié)會聯(lián)席會長。
陳俊龍教授(C. L. Philip Chen),華南理工大學(xué)特聘講席教授、博士生導(dǎo)師、計算機科學(xué)與工程學(xué)院院長,教育部健康智能與數(shù)字平行人工程中心主任,廣東省人工智能產(chǎn)業(yè)協(xié)會聯(lián)席會長。他是IEEE Life Fellow、AAAS Fellow、IAPR Fellow、歐洲科學(xué)院院士(Academia Europaea)、歐洲科學(xué)與藝術(shù)院院士(EASA)、俄羅斯工程院外籍院士、中國自動化學(xué)會(CAA) 、中國人工智能學(xué)會(CAAI)及香港工程師學(xué)會 (HKIE) Fellow。陳教授曾任中國自動化學(xué)會副理事長,兩個IEEE 頂級期刊主編,獲IEEE 諾伯特·維納獎、IEEE約瑟夫·沃爾終身成就獎、吳文俊人工智能領(lǐng)域杰出貢獻獎、美國普渡大學(xué)杰出電機計算機杰出校友獎等榮譽、2025福布斯中國人工智能影響力人物。連續(xù)6年被列為全球高被引科學(xué)家及斯坦福大學(xué)發(fā)布的全球前2%頂尖科學(xué)家榜單。在高排名學(xué)者(Highly Ranked Scholars™ ) 計算機類(Computer Science)近五年的影響力全國排名中名列第一,位列全球第8名。陳教授主要從事計算智能系統(tǒng)、數(shù)據(jù)挖掘和知識發(fā)現(xiàn)、邊緣智能、控制論和無人系統(tǒng)的研究。他圍繞智能系統(tǒng)與控制、計算智能、數(shù)據(jù)科學(xué)等科研方向開展研究工作超過40年,在該領(lǐng)域取得一系列學(xué)術(shù)創(chuàng)新性成果。他曾獲中國自動化學(xué)會自然科學(xué)獎一等獎、中國圖形圖像學(xué)會教育教學(xué)成果獎一等獎、及廣東省科技進步獎一等獎。
報告題目:大小模型融合創(chuàng)新技術(shù)與邊緣智能之探討
隨著大模型技術(shù)的發(fā)展,國內(nèi)外大量的研究機構(gòu)都開始進行大模型參數(shù)量競賽與算力競賽,這引發(fā)了學(xué)術(shù)界對當(dāng)前人工智能發(fā)展道路的批判性思考。一方面,大模型研究與應(yīng)用仍高度依賴以國外為主的高性能計算生態(tài),對于大模型技術(shù)的自主安全難以把控。另一方面,當(dāng)前大部分的工業(yè)智能化場景對于大模型性能的利用與付出的計算成本不成正比,反而需要更高效、更輕量的模型,尤其是在邊緣端與環(huán)境交互的部署。針對這一發(fā)展問題,本次匯報將結(jié)合當(dāng)前的大模型與小模型的研究現(xiàn)狀,分析未來人工智能的大小模型協(xié)同發(fā)展的技術(shù)探討及其對于未來產(chǎn)業(yè)發(fā)展的趨勢,同時也探討邊緣智能的理論基礎(chǔ)、算法與模型。
(2)莊越挺,國家杰出青年基金獲得者,教育部長江學(xué)者特聘教授。
莊越挺,國家杰出青年基金獲得者,教育部長江學(xué)者特聘教授,973項目首席科學(xué)家,“百千萬人才工程”國家級人選,享受國家政府特殊津貼,中國人工智能學(xué)會會士,中國圖像圖形學(xué)學(xué)會會士,浙江省特級專家?,F(xiàn)任浙江大學(xué)學(xué)術(shù)委員會副主任,中國人工智能學(xué)會副理事長,浙江大學(xué)求是特聘教授,教育部人工智能協(xié)同創(chuàng)新中心主任,數(shù)字圖書館教育部工程研究中心主任,浙江省計算機學(xué)會理事長。曾任浙江大學(xué)計算機學(xué)院院長,浙江大學(xué)人工智能研究所所長,中國圖像圖形學(xué)學(xué)會副理事長。主要從事人工智能、大數(shù)據(jù)智能處理、多媒體信息檢索、跨媒體計算理論等領(lǐng)域的研究。作為第一完成人,曾獲國家科技進步獎二等獎、浙江省科技進步獎一等獎等多項獎勵。
報告題目:基于大小模型協(xié)同的跨媒體智能研究及進展
多模態(tài)預(yù)訓(xùn)練大模型(MLLM) 是當(dāng)前實現(xiàn)跨媒體智能最有效的途徑,在理解、推理、生成等能力上的性能表現(xiàn)已經(jīng)達到了新的高度,甚至超過人類水平,在具身智能上具有重要的應(yīng)用前景。 但MLLM并非萬能,存在著幻覺多、推理效率低、成本高、專用能力缺乏等問題;另一方面,開源社區(qū)中已積累了數(shù)量眾多的小模型,它們具有豐富多樣、輕量高效、專用性強等優(yōu)點,也被廣泛地使用著。大小模型協(xié)同,便是將兩者的優(yōu)勢互補,將大小模型緊密協(xié)作起來。本報告從大小模型協(xié)同思想的背景出發(fā),剖析其中的科學(xué)問題,綜述當(dāng)前國際上的主要研究現(xiàn)狀,重點是分享報告人及團隊近期的研究進展。
(3)劉云新,清華大學(xué)國強教授,清華大學(xué)智能產(chǎn)業(yè)研究院首席研究員,IEEE Fellow。
劉云新,清華大學(xué)國強教授,清華大學(xué)智能產(chǎn)業(yè)研究院首席研究員,IEEE Fellow,清華大學(xué)-亞信科技(中國)有限公司聯(lián)合研究中心主任,國家重點研發(fā)計劃項目負(fù)責(zé)人,國家高層次人才項目入選者,原微軟亞洲研究院異構(gòu)計算研究組負(fù)責(zé)人。長期從事AIoT、移動計算、邊緣計算、異構(gòu)計算等研究,發(fā)表學(xué)術(shù)論文150多篇,擁有發(fā)明專利20余項,研究成果應(yīng)用到微軟的多項產(chǎn)品中。獲得2023 中國自動化學(xué)會科技進步一等獎、2022 中國計算機學(xué)會科技進步一等獎、MobiSys 2021大會最佳論文獎、MobiCom 2015最佳演示獎等獎項。曾任MobiSys 2023程序委員會共同主席和MobiHoc 2021大會共同主席。
報告題目:端側(cè)模型推理優(yōu)化和終端智能體
端側(cè)智能技術(shù)通過將AI模型直接部署并運行在手機、無人機、自動駕駛汽車、機器人等終端設(shè)備上,在數(shù)據(jù)安全、隱私保護、低延遲、低成本及高可靠性等方面具備顯著優(yōu)勢。然而,由于終端設(shè)備在算力、內(nèi)存容量和帶寬、以及電池能量供給等方面的資源限制,端側(cè)模型推理往往面臨性能瓶頸。本報告將闡述端側(cè)智能領(lǐng)域的技術(shù)挑戰(zhàn),重點介紹端側(cè)模型推理優(yōu)化技術(shù),并探討大語言模型驅(qū)動的終端智能體研究。
(4)吳帆,上海交通大學(xué)計算機學(xué)院特聘教授、常務(wù)副院長,國家自然科學(xué)基金杰出青年科學(xué)基金獲得者。
吳帆博士,現(xiàn)為上海交通大學(xué)計算機學(xué)院特聘教授、常務(wù)副院長,國家自然科學(xué)基金杰出青年科學(xué)基金獲得者。在移動端智能計算、大小模型協(xié)同、無線網(wǎng)絡(luò)等領(lǐng)域發(fā)表學(xué)術(shù)論文300余篇。先后擔(dān)任IEEE Transactions on Mobile Computing等5個國際學(xué)術(shù)期刊編委。曾獲教育部自然科學(xué)獎一等獎2項、上海市科技進步獎一等獎,以及7次國際學(xué)術(shù)會議論文獎。作為項目負(fù)責(zé)人承擔(dān)科技創(chuàng)新2030“新一代人工智能”重大項目、國家自然科學(xué)基金重點項目等。
報告題目:移動端輕量化智能計算
隨著手機、可穿戴設(shè)備、機器人、無人車、無人機等移動終端設(shè)備在計算、存儲等方面能力的大幅提升,在移動端設(shè)備上進行智能化的數(shù)據(jù)處理(例如特征計算、模型推斷和訓(xùn)練)成為新趨勢。本報告將會追尋端智能技術(shù)的發(fā)展脈絡(luò),分享我們團隊在端側(cè)智能推理、大規(guī)模聯(lián)合學(xué)習(xí)以及端云協(xié)同分布式智能支撐系統(tǒng)等方面的研究進展。
(5)李國齊,國家杰出青年基金獲得者。
李國齊,中國科學(xué)院自動化所研究員,博士生導(dǎo)師,腦認(rèn)知與類腦智能全國重點實驗室副主任,通用類腦智能大模型北京市重點實驗室主任,國家杰出青年基金獲得者;在Nature、Nature子刊、Science 子刊等期刊和AI頂會上發(fā)表論文 200余篇,論文被引用1.7萬余次;主持國家自然科學(xué)基金重點項目、聯(lián)合重點項目、科技部重點研發(fā)項目等30余項;擔(dān)任IEEE TNNLS,IEEE TCDS和清華大學(xué)學(xué)報-自然科學(xué)版編委;曾獲得中國自動化學(xué)會自然科學(xué)一等獎,ECCV最佳論文獎提名,中國算力大會最佳論文獎,曾入選北京市杰青,中國科學(xué)院百人計劃,DeepTech中國智能計算科技創(chuàng)新人物,中國算力青年先鋒人物。
報告題目:類腦通用智能大模型
當(dāng)前大模型主要基于Transformer架構(gòu),在Scaling law驅(qū)動下越來越大,然而Transformer具有二次方計算復(fù)雜度,Scaling law驅(qū)動難以為繼;我們需要思考如何找到一條可持續(xù)推動當(dāng)前AI系統(tǒng)到下一個階段的通用人工智能道路。本報告借鑒大腦信息處理機制,聚焦樹突脈沖神經(jīng)網(wǎng)絡(luò),結(jié)合報告人的科研進展,闡述構(gòu)建新一代通用類腦智能大模型基礎(chǔ)架構(gòu)的主要科學(xué)問題,探索一條基于新架構(gòu)構(gòu)建低功耗人工智能的新路徑。
(6)王田,北京師范大學(xué)長聘教授,國家級青年拔尖人才,教育部工程研究中心主任。
王田,北京師范大學(xué)長聘教授,博士生導(dǎo)師,國家級青年拔尖人才,教育部“大數(shù)據(jù)云邊智能協(xié)同”工程研究中心主任,科技部重點研發(fā)項目主持人,廣東普通高校創(chuàng)新團隊帶頭人。香港城市大學(xué)博士,連續(xù)5年入選全球前2%頂尖科學(xué)家終身榜單,入選ScholarGPS前0.05%頂尖科學(xué)家。從事物聯(lián)網(wǎng)、邊緣智能領(lǐng)域的研究工作,在CCF A類以及Transactions系列期刊上發(fā)表論文100余篇。論文被引17000多次,H指數(shù)76,ESI高被引論文10篇(含3篇ESI熱點論文),授權(quán)發(fā)明專利30項(轉(zhuǎn)化2項),主持科技部國家重點研發(fā)計劃1項、國家自然科學(xué)基金5項,獲廣東省科技進步二等獎(排名第一)、福建省自然科學(xué)三等獎(兩次,排名第一)、福建省科技進步二等獎(排名第二)、廣東省計算機學(xué)會青年科技獎(年度唯二)、中國仿真學(xué)會自然科學(xué)一等獎,IEEE/ACM IWQoS 2024 Best Paper Runner-up獎、IEEE CBD 2024 Best Paper獎、IEEE MSN 2024 Best Paper獎、UbiSec 2024 Best Paper獎、BlockSys 2025 Best Paper獎。
報告題目:大小模型協(xié)同在智能作業(yè)批改中的應(yīng)用
智能作業(yè)批改通過自動化技術(shù)大幅提高了批改效率,減少了教師的工作負(fù)擔(dān),同時能夠提供即時反饋,幫助學(xué)生及時了解自己的學(xué)習(xí)情況并進行改進。本報告介紹大小模型協(xié)同技術(shù)的應(yīng)用,有效提升了批改效率與準(zhǔn)確性。大模型憑借強大的語言理解與生成能力,負(fù)責(zé)解析題目要求、理解學(xué)生答案的語義,并生成初步評分與反饋建議。小模型則專注于特定題型或知識點的精細(xì)判斷,從而實現(xiàn)高效、精準(zhǔn)的局部判斷。通過大小模型協(xié)同,系統(tǒng)兼顧計算效率與批改質(zhì)量,為教育智能化提供有力支持。
六、論壇愿景
本次“大小模型協(xié)同智能計算”技術(shù)論壇將以主題演講、技術(shù)對話、圓桌論壇等多元形式,展示從理論探索到工程落地的全鏈路創(chuàng)新實踐。希望借助 CNCC 這一高能級交流平臺,推動大小模型協(xié)同計算走向更廣泛的產(chǎn)業(yè)化應(yīng)用,并引領(lǐng)其在智慧醫(yī)療、智慧教育、智慧政務(wù)等領(lǐng)域釋放更大價值。我們期待這一論壇成為激發(fā)跨界合作與技術(shù)突破的重要契機,為中國乃至全球智能計算技術(shù)的發(fā)展貢獻新的思路與力量。