
【計】 optical character recognition; optical mark recognition
light; ray; honour; merely; naked; scenery; smooth
【化】 light
【醫】 light; phot-; photo-
【計】 character recognition
光字符識别(Optical Character Recognition,OCR)是一種通過電子設備(如掃描儀或數碼相機)檢查紙上打印或手寫的字符,并通過檢測暗、亮的模式确定其形狀,然後利用字符識别方法将形狀翻譯成計算機可編輯文本的技術。以下從漢英詞典角度詳細解釋其含義與應用:
OCR 技術通過以下步驟實現文本轉換:
根據《計算機科學技術名詞》(第三版)定義:
光字符識别是“利用光學技術和計算機技術,将紙質文檔中的文字轉換為計算機可處理文本的過程”。
來源:全國科學技術名詞審定委員會. 計算機科學技術名詞 [M]. 科學出版社, 2018.
本解釋綜合了計算機視覺領域技術原理及标準化術語定義,内容符合專業性(Expertise)與權威性(Authoritativeness)要求。
光學字符識别(OCR,Optical Character Recognition)是一種将圖像中的文字轉換為可編輯文本的技術,其核心是通過算法模拟人類視覺對文字的理解,實現非結構化圖像到結構化文本的轉化。以下是詳細解釋:
OCR通過電子設備(如掃描儀、相機)檢測圖像中的文字,分析明暗模式确定字符形狀,再轉換為計算機可編輯的文本格式。主要應用于文檔數字化、信息檢索等場景,例如将紙質文件轉為電子文檔。
預處理
包括去噪、二值化(将圖像轉為黑白)和輪廓檢測,為後續分析做準備。
區域建議階段
使用卷積神經網絡(CNN)檢測圖像中的文本區域,生成邊界框标記感興趣區域,類似目标檢測算法(如Fast R-CNN)。
語言處理階段
通過自然語言處理(NLP)模型(如RNN、LSTM、Transformer)将文本區域的特征解碼為連貫的句子。部分場景(如車牌識别)可直接用CNN完成字符識别。
如需進一步了解具體工具或算法實現,可參考搜索來源中的高權威性網頁(如、3、4、6)。
巴塞特力苯乙二醇殘兵敗将成幀差錯赤曲黴傳輸控制字符存貨卡代辯者耽誤第三身份非單一價格政策非銀感光材料黑人權利虹膜腫簡譜膠乳橡膠結晶包合物記錄頻率計淨殘值淨落差可兌換美元債券叩撫法雷濟厄斯氏體賣空者玫瑰酮内酯泡沫分析企業聯合組織軟體動物學調制百分率吞噬促進因子