精品国产色欧洲激情_中文字幕在线欧美日韩制服在线_欢迎观看网站影片国产在线观看伊_日本高清一本视频_ww亚洲无码免费在线观看_午夜片无码区观看_欧美性爱福利资源_丰满少妇肥唇翘臀ⅩXX_欧美日韩另类久久_国内揄拍国内精品对白86

其他
新聞詳情

OCR光學字符識別技術

發(fā)布時間:2023-09-04 10:58:38 瀏覽次數(shù):863

OCR光學字符識別技術

什么是OCR光學字符識別?

OCR (Optical Character Recognition,光學字符識別)是指電子設備(例如掃描儀或數(shù)碼相機)檢查紙上打印的字符,通過檢測暗、亮的模式確定其形狀,然后用字符識別方法將形狀翻譯成計算機文字的過程。衡量一個OCR系統(tǒng)性能好壞的主要指標有:拒識率、誤識率、識別速度、用戶界面的友好性,產品的穩(wěn)定性,易用性及可行性等。

在工業(yè)領域,光學字符識別 (OCR) 是一項機器視覺任務,包括從圖像中提取文本信息。

OCR 是高精度文本識別技術,并且對中等顆粒圖形噪聲無懈可擊。它們還適用于識別使用點陣打印機制作的字符。該技術為部分遮擋或變形的字符提供了令人滿意的結果。

識別過程的效率主要取決于文本分割結果的質量。大多數(shù)識別案例都可以使用提供的一組識別模型完成。在其他情況下,可以輕松準備新的識別模型。

OCR光學字符識別技術步驟

為了實現(xiàn)最準確的識別,有必要進行仔細的文本提取和分段。從圖像獲取文本的總體過程包括以下步驟:

獲取文本位置

文本的位置是固定的,它由稱為掩碼的框描述。例如,個人身份證是按照正式規(guī)范制作的。每個數(shù)據(jù)字段的位置是已知的。經(jīng)過良好校準的視覺系統(tǒng)可以拍攝文本位置幾乎恒定的圖像。

文本位置不是固定的,但它與輸入圖像上的特征元素或特殊標記(光學標記)相關。要獲取文本的位置,必須找到光學標記。這可以通過模板匹配、1D 邊緣檢測或其他技術完成。

未指定文本的位置,但可以通過圖像閾值輕松地從背景中分離字符。然后可以使用 Blob 分析技術找到正確的字符。

從背景中提取文本

文本提取過程中的主要復雜情況可能是光線不均勻。某些技術(如光規(guī)范化或邊緣銳化)有助于查找字符。

此時,已提取的文本區(qū)域已準備好進行分段。

分段文本

文本區(qū)域分割是將區(qū)域拆分為行和單個字符的過程。只有當每個區(qū)域包含一個字符時,識別才可能實現(xiàn)。

當文本文本行分開時,每行必須拆分為單獨的字符。

接下來,提取的字符將從圖形表示形式轉換為文本表示形式。

調用OCR模型庫

通過調用OCR模型庫,使識別到的字符以文本形式與模型庫進行比對,匹配數(shù)據(jù)最相似的模板,得出準確的字符信息。

字符識別

通常來說需要選擇適當?shù)淖址?guī)范大小,來分類字符的大小。

 

在線客服 雙翌客服
客服電話
  • 0755-23712116
  • 13310869691