
【计】 flag data
mark; sign; symbol; badge; earmark; tag
【计】 badge; benchmarking; F; L; labelling; marker; sentinel; tag; tagging
【化】 code; mark; marks; stamping; tag; tagging
【医】 labelling; Sig.; signa; signature; symbol
【经】 mark; marking
data
【计】 D; data
【化】 data
【经】 data; datum; figure; quantitative data
在汉英词典视角下,“标记数据”(Biāojì Shùjù)指为原始数据添加特定标签或注释的过程及结果,旨在赋予数据可被机器识别的语义信息。其核心含义包含以下层面:
动词含义(标记/数据标注)
指人工或算法对原始数据(如文本、图像、音频)添加分类标签的过程。英文对应“Tagging Data” 或“Labeling Data”,例如为图像中的物体标注“猫”“汽车”等类别标签。据《牛津英语词典》定义,标签(Label)是“用于识别或分类信息的标识符”(Oxford English Dictionary, "Label"词条)。
名词含义(已标记的数据集)
指完成标注后形成的结构化数据集,英文称“Tagged Data” 或“Labeled Data”。此类数据包含特征(如图像像素)和对应标签(如“狗”),是监督学习的基础。剑桥词典将“Tagged”解释为“附加了识别信息的”(Cambridge Dictionary, "Tagged"词条)。
在机器学习领域,标记数据通过提供监督信号训练模型。例如:
学术定义
根据《人工智能:现代方法》(Russell & Norvig),标记数据是“包含输入特征与目标输出配对的数据集”,用于建立输入到输出的映射关系(第5版,第702页)。
行业标准
国际数据管理协会(DAMA)将数据标记定义为“通过元数据增强数据语义的过程”,强调其提升数据可解释性的作用(DAMA-DMBOK, 2nd Edition)。
标记数据支撑关键AI应用,如:
权威来源链接:
标记数据(Data Annotation/Labeling)是指通过人工或自动化方式为原始数据添加分类、注释或标签的过程,使其能够被计算机系统识别和学习。以下是详细解释:
技术基础
标记数据是计算机视觉(CV)和自然语言处理(NLP)的关键预处理步骤。通过标注图像、文本或视频的特征(如物体边界框、情感分类等),数据被转化为机器可理解的格式,从而训练AI模型识别规律。
应用领域
常见形式
实施过程
通常依赖人工标注员对数据进行精细化处理,例如标注医疗影像中的病灶区域,或为语音片段添加文字转录。
如需进一步了解具体标注案例或技术细节,可参考腾讯云开发者社区等专业来源。
矮子按目标利润率定价巴布克苦式锅炉波罗的海不传输残留错误率串珠状的脆性红细胞措辞谨慎代特氏指节碘乙烯二氯化铬二十碳烯分模杯分析方式副价公立的交互亲力久隔的旅游皂柠康酐浓度极限欧文氏菌族梢膜性神经末梢手工汇编语言手镯试验输入服务图论脱硼作用未解释的