電子系彭良瑞研究組古籍識別與深度學習研究成果獲DAS2016最佳論文獎
清華新聞網(wǎng)4月21日電 近日,清華大學電子工程系彭良瑞副教授研究組在希臘召開的第12屆文檔分析系統(tǒng)國際研討會(DAS 2016)上發(fā)表論文“基于卷積神經(jīng)網(wǎng)絡(luò)遷移學習的古籍漢字識別”,獲得DAS 2016 最佳論文獎。論文第一作者博士生湯野駿出席會議并做口頭報告,獲得與會專家的好評。DAS 2016是國際模式識別學會主辦的文字識別領(lǐng)域的國際學術(shù)會議,自1994年起,每兩年舉辦一次。
古籍漢字識別是一種將古籍圖像轉(zhuǎn)換為可全文檢索文本的技術(shù),由于其技術(shù)難度大,傳統(tǒng)的模式識別與機器學習方法尚未提供完善的解決方案。卷積神經(jīng)網(wǎng)絡(luò)是機器學習領(lǐng)域新興的深度學習方法之一,通常訓練一個較復(fù)雜的卷積神經(jīng)網(wǎng)絡(luò)需要數(shù)以百萬計的海量標注樣本數(shù)據(jù),但是在缺乏具有類別標記訓練樣本的古籍漢字識別任務(wù)中,直接運用卷積神經(jīng)網(wǎng)絡(luò)無法獲得較好的效果。論文所提出的方法先利用從現(xiàn)代印刷體繁體漢字樣本集上訓練得到的卷積神經(jīng)網(wǎng)絡(luò)參數(shù),再輔以少量實際古籍漢字樣本集進行遷移學習,最終得到適用于古籍漢字識別的模型。論文還對模型結(jié)構(gòu)與參數(shù)、樣本選取方案等技術(shù)要點進行了深入細致的分析。這一研究成果對于發(fā)展我國古籍全文數(shù)字化技術(shù)、進一步促進珍貴中華古籍資源的保護和利用具有重要意義。

DAS 2016 最佳論文獎證書

湯野駿在DAS2016會議期間與國際學術(shù)界最早進行漢字識別研究的George Nagy教授交流。
論文工作有關(guān)古籍漢字識別方面的研究得到國家自然科學基金委員會與法國國家科研署共同資助的“手寫體中文古籍識別”項目的支持,項目研究用的古籍樣本由合作單位國家圖書館提供;有關(guān)深度學習方面的研究得到日本東芝公司國際合作項目的支持,項目負責人均為彭良瑞副教授。論文作者為清華大學的湯野駿、彭良瑞、徐倩、王言偉和日本東芝公司的古畑彰夫。
彭良瑞長期從事多文種文字識別與古籍識別方面的研究工作。此前,她指導的碩士生馮繼雄發(fā)表的論文“基于高斯過程風格映射的古籍漢字識別方法”,于2015年2月獲得第22屆文檔識別與檢索國際會議最佳學生論文獎。彭良瑞研究組所屬的電子工程系智能圖文信息處理研究室在丁曉青教授的帶領(lǐng)下,在文字識別、人臉識別、視頻監(jiān)控等領(lǐng)域具有長期深厚的研究基礎(chǔ)。彭良瑞也是電子工程系近期成立的媒體大數(shù)據(jù)認知計算研究中心的技術(shù)骨干,該中心主任王生進教授指出,將深度學習前沿技術(shù)與困難的古籍漢字識別課題結(jié)合,是這項論文工作做出的重要創(chuàng)新。
供稿:電子系 編輯:文 杰