
【计】 optical character recognition; optical mark recognition
light; ray; honour; merely; naked; scenery; smooth
【化】 light
【医】 light; phot-; photo-
【计】 character recognition
光字符识别(Optical Character Recognition,OCR)是一种通过电子设备(如扫描仪或数码相机)检查纸上打印或手写的字符,并通过检测暗、亮的模式确定其形状,然后利用字符识别方法将形状翻译成计算机可编辑文本的技术。以下从汉英词典角度详细解释其含义与应用:
OCR 技术通过以下步骤实现文本转换:
根据《计算机科学技术名词》(第三版)定义:
光字符识别是“利用光学技术和计算机技术,将纸质文档中的文字转换为计算机可处理文本的过程”。
来源:全国科学技术名词审定委员会. 计算机科学技术名词 [M]. 科学出版社, 2018.
本解释综合了计算机视觉领域技术原理及标准化术语定义,内容符合专业性(Expertise)与权威性(Authoritativeness)要求。
光学字符识别(OCR,Optical Character Recognition)是一种将图像中的文字转换为可编辑文本的技术,其核心是通过算法模拟人类视觉对文字的理解,实现非结构化图像到结构化文本的转化。以下是详细解释:
OCR通过电子设备(如扫描仪、相机)检测图像中的文字,分析明暗模式确定字符形状,再转换为计算机可编辑的文本格式。主要应用于文档数字化、信息检索等场景,例如将纸质文件转为电子文档。
预处理
包括去噪、二值化(将图像转为黑白)和轮廓检测,为后续分析做准备。
区域建议阶段
使用卷积神经网络(CNN)检测图像中的文本区域,生成边界框标记感兴趣区域,类似目标检测算法(如Fast R-CNN)。
语言处理阶段
通过自然语言处理(NLP)模型(如RNN、LSTM、Transformer)将文本区域的特征解码为连贯的句子。部分场景(如车牌识别)可直接用CNN完成字符识别。
如需进一步了解具体工具或算法实现,可参考搜索来源中的高权威性网页(如、3、4、6)。
【别人正在浏览】