OCR光學字符識別技術

                  • 作者:

                  • 來源:光虎光電科技(天津)有限公司

                  • 訪問量:78

                  • 發布時間:2022-06-13 08:47:25

                  什么是OCR光學字符識別?


                  OCR (Optical Character Recognition,光學字符識別)是指電子設備(例如掃描儀或數碼相機)檢查紙上打印的字符,通過檢測暗、亮的模式確定其形狀,然后用字符識別方法將形狀翻譯成計算機文字的過程。衡量一個OCR系統性能好壞的主要指標有:拒識率、誤識率、識別速度、用戶界面的友好性,產品的穩定性,易用性及可行性等。


                  在工業領域,光學字符識別 (OCR) 是一項機器視覺任務,包括從圖像中提取文本信息。

                  OCR 最先進的技術提供高精度的文本識別,并且對中等顆粒圖形噪聲無懈可擊。它們還適用于識別使用點陣打印機制作的字符。該技術為部分遮擋或變形的字符提供了令人滿意的結果。


                  識別過程的效率主要取決于文本分割結果的質量。大多數識別案例都可以使用提供的一組識別模型完成。在其他情況下,可以輕松準備新的識別模型。


                  OCR光學字符識別技術步驟


                  為了實現最準確的識別,有必要進行仔細的文本提取和分段。從圖像獲取文本的總體過程包括以下步驟:


                  從圖像中讀取文本


                  壹 |
                  貳 |
                  叁 |
                  肆 |
                  伍 |

                  獲取文本位置

                  從背景中提取文本

                  分段文本

                  使用準備好的OCR模型

                  字符識別




                  獲取文本位置


                  文本的位置是固定的,它由稱為掩碼的框描述。例如,個人身份證是按照正式規范制作的。每個數據字段的位置是已知的。經過良好校準的視覺系統可以拍攝文本位置幾乎恒定的圖像。

                   




                  文本位置不是固定的,但它與輸入圖像上的特征元素或特殊標記(光學標記)相關。要獲取文本的位置,必須找到光學標記。這可以通過模板匹配、1D 邊緣檢測或其他技術完成。


                  未指定文本的位置,但可以通過圖像閾值輕松地從背景中分離字符。然后可以使用 Blob 分析技術找到正確的字符。

                   




                  從背景中提取文本


                  文本提取過程中的主要復雜情況可能是光線不均勻。某些技術(如光規范化或邊緣銳化)有助于查找字符。




                  原始圖像

                   

                  光規范化后的圖像 



                  使用 Fourier 變換進行低頻圖像阻尼后的圖像


                   


                  使用不均勻的光線采樣圖

                  經過光規范化處理的不均勻光線圖像


                  此時,已提取的文本區域已準備好進行分段。



                  分段文本


                  文本區域分割是將區域拆分為行和單個字符的過程。只有當每個區域包含一個字符時,識別才可能實現。

                   


                  使用區域形態過濾器將文本拆分為行的過程


                  當文本文本行分開時,每行必須拆分為單獨的字符。



                  使用拆分區域得到多個字符的字符分割


                  接下來,提取的字符將從圖形表示形式轉換為文本表示形式。


                  調用OCR模型庫


                  通過調用OCR模型庫,使識別到的字符以文本形式與模型庫進行比對,匹配數據最相似的模板,得出準確的字符信息。


                  字符識別


                  通常來說需要選擇適當的字符規范大小,來分類字符的大小。





                  【來源:光虎視覺內部培訓資料】
                                                                                                           
                  光虎視覺專業生產由德國設計的工業鏡頭

                  以高精度雙遠心鏡頭為核心,涵蓋高性能FA定焦鏡頭、變倍鏡頭等產品。
                  可實現為客戶定制化研發生產。光虎視覺還代理歐美日機器視覺全系列產品。
                  如面陣與線掃工業相機、智能相機、3D相機、紅外與紫外相機、光源、圖像采集卡、機器視覺軟件及其他周邊產品。



                  国产美女视频国产视视频,国产午夜福利片在线观看,精精国产XXXX视频在线