湿气重是不是不能吃西瓜,糖心vlog新官网入口

無(wú)標(biāo)題文檔

我們讓計(jì)算機(jī)識(shí)圖認(rèn)字

●丁曉青

ＴＨＯＣＲ具有強(qiáng)大的識(shí)圖認(rèn)字功能

電子系智能圖文研究室集十余年的努力，致力于使計(jì)算機(jī)具有識(shí)圖認(rèn)字的人類感知的能力，能自動(dòng)認(rèn)識(shí)各種文字和文本圖像，使人們長(zhǎng)期的夢(mèng)想終于部分成真。

 在今天，我們可以快速、準(zhǔn)確、輕易地將印刷的報(bào)章雜志、書籍文本自動(dòng)變成計(jì)算機(jī)可閱讀的電子文檔；可以利用筆寫字與計(jì)算機(jī)交流會(huì)話；可以將人們書寫的文字表格自動(dòng)輸入計(jì)算機(jī)；可以將過(guò)去必須由人們識(shí)圖認(rèn)字解決的問(wèn)題，交由計(jì)算機(jī)自動(dòng)解決和實(shí)現(xiàn)，大大解脫人們漢字輸入繁重的勞動(dòng)，為計(jì)算機(jī)智能信息處理開(kāi)辟了極為寬廣的道路。

 在這十余年的努力中，我們從模仿人類視覺(jué)感知出發(fā)，即人類的視覺(jué)感知是形象思維，而非邏輯思維過(guò)程，研究和發(fā)展了模式識(shí)別信息熵理論，基于統(tǒng)計(jì)模式識(shí)別的理論和算法，在特征提取和選擇、分類器設(shè)計(jì)和集成、識(shí)別可信度分析、利用上下文的模式識(shí)別算法等方面的研究成果，解決了包括數(shù)量達(dá)兩萬(wàn)余字的超大集合漢字在內(nèi)的東方多國(guó)文字文本圖像的計(jì)算機(jī)識(shí)圖認(rèn)字問(wèn)題；解決了從聯(lián)機(jī)手寫漢字識(shí)別到脫機(jī)手寫漢字和數(shù)字等極大變化模式類別的識(shí)別問(wèn)題；解決了低質(zhì)量、低清晰度文字的識(shí)別問(wèn)題；還解決了從版面自動(dòng)分析、文檔自動(dòng)識(shí)別、版面自動(dòng)理解和版面自動(dòng)重構(gòu)為一體的文本全信息數(shù)字化問(wèn)題。

 在這十余年的努力中，我們不僅在理論和方法上取得成果，更重要的是把研究成果投入到實(shí)際的應(yīng)用中，開(kāi)發(fā)成為產(chǎn)品，在千萬(wàn)人們的文檔數(shù)字化實(shí)際應(yīng)用中經(jīng)受考驗(yàn)，反饋促進(jìn)我們的研究。我們的ＴＨＯＣＲ產(chǎn)品有十年歷史，有國(guó)內(nèi)６５％以上市場(chǎng)，在我國(guó)漢語(yǔ)信息資源建設(shè)中發(fā)揮著重要作用；業(yè)已聞名國(guó)內(nèi)外，并授權(quán)于ＩＢＭ、摩托羅拉、諾基亞等許多國(guó)際知名公司。我們的中日韓東方文字識(shí)別系統(tǒng)授權(quán)于微軟公司，經(jīng)美國(guó)Ｓｃａｎｓｏｆｔ公司評(píng)測(cè)，居國(guó)際領(lǐng)先水平。

2002年09月29日 00:00:00

相關(guān)新聞

讀取內(nèi)容中,請(qǐng)等待...

最新動(dòng)態(tài)

關(guān)于我們 │ 友情鏈接 │ 清華地圖