品牌咨詢
來源:
|
作者:tpl-c262dff
|
發(fā)布時間: 2021-03-24
|
152 次瀏覽
|
分享到:
擁有13年成功經(jīng)驗的品牌咨詢公司.提供品牌戰(zhàn)略管理,市場營銷策劃,產(chǎn)品力提升,傳播等服務
以下為臨時文案,內(nèi)容由您定義--------------------------------------------------------------------------
利用計算機自動識別字符的技術,是模式識別應用的一個重要領域。人們在生產(chǎn)和生活中,要處理大量的文字、報表和文本。為了減輕人們的勞動,提高處理效率,50年代開始探討一般文字識別方法,并研制出光學字符識別器。60年代出現(xiàn)了采用磁性墨水和特殊字體的實用機器。60年代后期,出現(xiàn)了多種字體和手寫體文字識別機,其識別精度和機器性能都基本上能滿足要求。如用于信函分揀的手寫體數(shù)字識別機和印刷體英文數(shù)字識別機。70年代主要研究文字識別的基本理論和研制高性能的文字識別機,并著重于漢字識別的研究。
文字識別一般包括文字信息的采集、信息的分析與處理、信息的分類判別等幾個部分。
信息采集 將紙面上的文字灰度變換成電信號,輸入到計算機中去。信息采集由文字識別機中的送紙機構和光電變換裝置來實現(xiàn),有飛點掃描、攝像機、光敏元件和激光掃描等光電變換裝置。
信息分析和處理 對變換后的電信號消除各種由于印刷質(zhì)量、紙質(zhì)(均勻性、污點等)或書寫工具等因素所造成的噪音和干擾,進行大小、偏轉、濃淡、粗細等各種正規(guī)化處理。
信息的分類判別 對去掉噪聲并正規(guī)化后的文字信息進行分類判別,以輸出識別結果。
識別方法編輯
文字識別方法 文字識別方法基本上分為統(tǒng)計、邏輯判斷和句法三大類。常用的方法有模板匹配法和幾何特征抽取法。
① 模板匹配法 將輸入的文字與給定的各類別標準文字(模板)進行相關匹配,計算輸入文字與各模板之間的相似性程度,取相似度較大的類別作為識別結果。這種方法的缺點是當被識別類別數(shù)增加時,標準文字模板的數(shù)量也隨之增加。這一方面會增加機器的存儲容量,另一方面也會降低識別的正確率,所以這種方式適用于識別固定字型的印刷體文字。這種方法的優(yōu)點是用整個文字進行相似度計算,所以對文字的缺損、邊緣噪聲等具有較強的適應能力。
② 幾何特征抽取法 抽取文字的一些幾何特征,如文字的端點、分叉點、凹凸部分以及水平、垂直、傾斜等各方向的線段、閉合環(huán)路等,根據(jù)這些特征的位置和相互關系進行邏輯組合判斷,獲得識別結果。這種識別方式由于利用結構信息,也適用于手寫體文字那樣變型較大的文字。
文字識別
文字識別
應用領域編輯
文字識別可應用于許多領域,如閱讀、翻譯、文獻資料的檢索、信件和包裹的分揀、稿件的編輯和校對、大量統(tǒng)計報表和卡片的匯總與分析、銀行支票的處理、商品發(fā)票的統(tǒng)計匯總、商品編碼的識別、商品倉庫的管理,以及水、電、煤氣、房租、人身保險等費用的征收業(yè)務中的大量信用卡片的自動處理和辦公室打字員工作的局部自動化等。以及文檔檢索,各類證件識別,方便用戶快速錄入信息,提高各行各業(yè)的工作效率。
中國現(xiàn)狀編輯
隨著我國信息化建設的全面開展,OCR文字識別技術誕生20余年來,經(jīng)歷從實驗室技術到產(chǎn)品的轉變,已經(jīng)進入行業(yè)應用開發(fā)的成熟階段。相比發(fā)達國家的廣泛應用情況,OCR文字識別技術在國內(nèi)各行各業(yè)的應用還有著廣闊的空間。隨著國家信息化建設進入內(nèi)容建設階段,為OCR文字識別技術開創(chuàng)了一個全新的行業(yè)應用局面。文通,云脈技術、漢*等中國文字識別的領軍企業(yè)將會更加深入到信息化建設的各個領域。