8億年前月球遭遇流星體轟擊
來(lái)源:
|
作者:tpl-c262dff
|
發(fā)布時(shí)間: 2020-07-22
|
172 次瀏覽
|
分享到:
利用計(jì)算機(jī)自動(dòng)識(shí)別字符的技術(shù),是模式識(shí)別應(yīng)用的一個(gè)重要領(lǐng)域。人們?cè)谏a(chǎn)和生活中,要處理大量的文字、報(bào)表和文本。為了減輕人們的勞動(dòng),提高處理效率,50年代開(kāi)始探討一般文字識(shí)別方法,并研制出光學(xué)字符識(shí)別器。
以下為臨時(shí)文案,內(nèi)容由您定義--------------------------------------------------------------------------
利用計(jì)算機(jī)自動(dòng)識(shí)別字符的技術(shù),是模式識(shí)別應(yīng)用的一個(gè)重要領(lǐng)域。人們?cè)谏a(chǎn)和生活中,要處理大量的文字、報(bào)表和文本。為了減輕人們的勞動(dòng),提高處理效率,50年代開(kāi)始探討一般文字識(shí)別方法,并研制出光學(xué)字符識(shí)別器。60年代出現(xiàn)了采用磁性墨水和特殊字體的實(shí)用機(jī)器。60年代后期,出現(xiàn)了多種字體和手寫(xiě)體文字識(shí)別機(jī),其識(shí)別精度和機(jī)器性能都基本上能滿(mǎn)足要求。如用于信函分揀的手寫(xiě)體數(shù)字識(shí)別機(jī)和印刷體英文數(shù)字識(shí)別機(jī)。70年代主要研究文字識(shí)別的基本理論和研制高性能的文字識(shí)別機(jī),并著重于漢字識(shí)別的研究。
文字識(shí)別一般包括文字信息的采集、信息的分析與處理、信息的分類(lèi)判別等幾個(gè)部分。
信息采集 將紙面上的文字灰度變換成電信號(hào),輸入到計(jì)算機(jī)中去。信息采集由文字識(shí)別機(jī)中的送紙機(jī)構(gòu)和光電變換裝置來(lái)實(shí)現(xiàn),有飛點(diǎn)掃描、攝像機(jī)、光敏元件和激光掃描等光電變換裝置。
信息分析和處理 對(duì)變換后的電信號(hào)消除各種由于印刷質(zhì)量、紙質(zhì)(均勻性、污點(diǎn)等)或書(shū)寫(xiě)工具等因素所造成的噪音和干擾,進(jìn)行大小、偏轉(zhuǎn)、濃淡、粗細(xì)等各種正規(guī)化處理。
信息的分類(lèi)判別 對(duì)去掉噪聲并正規(guī)化后的文字信息進(jìn)行分類(lèi)判別,以輸出識(shí)別結(jié)果。
識(shí)別方法編輯
文字識(shí)別方法 文字識(shí)別方法基本上分為統(tǒng)計(jì)、邏輯判斷和句法三大類(lèi)。常用的方法有模板匹配法和幾何特征抽取法。
① 模板匹配法 將輸入的文字與給定的各類(lèi)別標(biāo)準(zhǔn)文字(模板)進(jìn)行相關(guān)匹配,計(jì)算輸入文字與各模板之間的相似性程度,取相似度較大的類(lèi)別作為識(shí)別結(jié)果。這種方法的缺點(diǎn)是當(dāng)被識(shí)別類(lèi)別數(shù)增加時(shí),標(biāo)準(zhǔn)文字模板的數(shù)量也隨之增加。這一方面會(huì)增加機(jī)器的存儲(chǔ)容量,另一方面也會(huì)降低識(shí)別的正確率,所以這種方式適用于識(shí)別固定字型的印刷體文字。這種方法的優(yōu)點(diǎn)是用整個(gè)文字進(jìn)行相似度計(jì)算,所以對(duì)文字的缺損、邊緣噪聲等具有較強(qiáng)的適應(yīng)能力。
② 幾何特征抽取法 抽取文字的一些幾何特征,如文字的端點(diǎn)、分叉點(diǎn)、凹凸部分以及水平、垂直、傾斜等各方向的線段、閉合環(huán)路等,根據(jù)這些特征的位置和相互關(guān)系進(jìn)行邏輯組合判斷,獲得識(shí)別結(jié)果。這種識(shí)別方式由于利用結(jié)構(gòu)信息,也適用于手寫(xiě)體文字那樣變型較大的文字。
文字識(shí)別
文字識(shí)別
應(yīng)用領(lǐng)域編輯
文字識(shí)別可應(yīng)用于許多領(lǐng)域,如閱讀、翻譯、文獻(xiàn)資料的檢索、信件和包裹的分揀、稿件的編輯和校對(duì)、大量統(tǒng)計(jì)報(bào)表和卡片的匯總與分析、銀行支票的處理、商品發(fā)票的統(tǒng)計(jì)匯總、商品編碼的識(shí)別、商品倉(cāng)庫(kù)的管理,以及水、電、煤氣、房租、人身保險(xiǎn)等費(fèi)用的征收業(yè)務(wù)中的大量信用卡片的自動(dòng)處理和辦公室打字員工作的局部自動(dòng)化等。以及文檔檢索,各類(lèi)證件識(shí)別,方便用戶(hù)快速錄入信息,提高各行各業(yè)的工作效率。
中國(guó)現(xiàn)狀編輯
隨著我國(guó)信息化建設(shè)的全面開(kāi)展,OCR文字識(shí)別技術(shù)誕生20余年來(lái),經(jīng)歷從實(shí)驗(yàn)室技術(shù)到產(chǎn)品的轉(zhuǎn)變,已經(jīng)進(jìn)入行業(yè)應(yīng)用開(kāi)發(fā)的成熟階段。相比發(fā)達(dá)國(guó)家的廣泛應(yīng)用情況,OCR文字識(shí)別技術(shù)在國(guó)內(nèi)各行各業(yè)的應(yīng)用還有著廣闊的空間。隨著國(guó)家信息化建設(shè)進(jìn)入內(nèi)容建設(shè)階段,為OCR文字識(shí)別技術(shù)開(kāi)創(chuàng)了一個(gè)全新的行業(yè)應(yīng)用局面。文通,云脈技術(shù)、漢*等中國(guó)文字識(shí)別的領(lǐng)軍企業(yè)將會(huì)更加深入到信息化建設(shè)的各個(gè)領(lǐng)域。