灣區(qū)時(shí)訊 幾千年華夏文明留下的海量古籍文獻(xiàn)資料,反映了當(dāng)時(shí)社會(huì)在政治、軍事、經(jīng)濟(jì)、科技、教育、文化等各個(gè)領(lǐng)域的發(fā)展,具有寶貴的歷史價(jià)值和社會(huì)價(jià)值。但由于語(yǔ)言的演變,通讀理解古籍文獻(xiàn)的難度較大,華南理工大學(xué)電子與信息學(xué)院金連文教授所在的“深度學(xué)習(xí)與視覺(jué)計(jì)算實(shí)驗(yàn)室”,致力于利用先進(jìn)的AI技術(shù)使古籍更易讀懂,發(fā)布了“通古大模型”“古籍文檔分析與識(shí)別系統(tǒng)”“彝文文檔分析識(shí)別系統(tǒng)”等多項(xiàng)成果,為中國(guó)古籍文物數(shù)據(jù)挖掘、知識(shí)發(fā)現(xiàn)、智能化開(kāi)發(fā)與利用等領(lǐng)域提供了技術(shù)支撐。
“通古大模型”操作界面
日前,“深度學(xué)習(xí)與視覺(jué)計(jì)算實(shí)驗(yàn)室”在EvaHan2023古籍文白翻譯國(guó)際比賽中獲得冠軍。賽后,金連文教授團(tuán)隊(duì)?wèi){借在古籍領(lǐng)域長(zhǎng)期積累的豐富大數(shù)據(jù)資源,加以自動(dòng)生成的對(duì)話模板,通過(guò)大模型指令微調(diào)技術(shù)訓(xùn)練,構(gòu)建了數(shù)字人文模型——通古大模型。該模型可智能實(shí)現(xiàn)文白翻譯、句讀標(biāo)點(diǎn)和古籍檢索等功能,使大眾更便捷有效地了解中國(guó)傳統(tǒng)文化。
“古籍文檔分析與識(shí)別系統(tǒng)”演示界面
金連文教授團(tuán)隊(duì)還開(kāi)發(fā)了業(yè)內(nèi)先進(jìn)的古籍文檔分析與識(shí)別系統(tǒng),集成了該團(tuán)隊(duì)自主研發(fā)的古籍句讀(自動(dòng)標(biāo)點(diǎn))和文本翻譯兩大功能。用戶只需提供一張古籍圖片,系統(tǒng)便能自動(dòng)識(shí)別并定位其中所有的文本,將識(shí)別出的文本按照正確的閱讀順序排序,添加標(biāo)點(diǎn)符號(hào)并翻譯為現(xiàn)代文,便于閱讀。
團(tuán)隊(duì)精心對(duì)這一系統(tǒng)進(jìn)行了算法優(yōu)化,能夠應(yīng)對(duì)現(xiàn)實(shí)場(chǎng)景中古籍文檔可能出現(xiàn)的各種挑戰(zhàn),例如書本彎曲、傾斜、密集以及低分辨率等問(wèn)題,實(shí)現(xiàn)了技術(shù)的突破。該系統(tǒng)兼具實(shí)用性和穩(wěn)健性,為推動(dòng)古籍?dāng)?shù)字化工作提供了有力支持。
系統(tǒng)相關(guān)技術(shù)曾獲2019年首屆數(shù)字中國(guó)創(chuàng)新大賽“文化傳承——漢字多場(chǎng)景識(shí)別”賽道第一名及總決賽唯一最佳算法能力獎(jiǎng)、2022年首屆大灣區(qū)國(guó)際算法算例大賽-古籍圖像分析與識(shí)別競(jìng)賽冠軍。
“彝文文檔分析識(shí)別系統(tǒng)”演示界面
此外,團(tuán)隊(duì)還開(kāi)發(fā)了彝文文檔分析識(shí)別系統(tǒng),能自動(dòng)精確定位并辨識(shí)圖片中的彝文文字(以自定義編碼給出輸出)。這項(xiàng)識(shí)別技術(shù)采用的彝文編碼基于團(tuán)隊(duì)今年早前與上海大學(xué)、上海合合信息科技公司聯(lián)合發(fā)布的業(yè)界首個(gè)古彝文基礎(chǔ)編碼數(shù)據(jù)庫(kù)。
古籍文獻(xiàn)是中國(guó)傳統(tǒng)文化的載體,金連文教授團(tuán)隊(duì)開(kāi)發(fā)的一系列技術(shù),有助于促進(jìn)中華優(yōu)秀傳統(tǒng)文化傳承與發(fā)展,對(duì)增強(qiáng)國(guó)家文化軟實(shí)力具有重要意義。
通訊員/華軒
編輯/劉秀
評(píng)論 0