
【计】 data marker
data
【计】 D; data
【化】 data
【经】 data; datum; figure; quantitative data
mark; sign; symbol; badge; earmark; tag
【计】 badge; benchmarking; F; L; labelling; marker; sentinel; tag; tagging
【化】 code; mark; marks; stamping; tag; tagging
【医】 labelling; Sig.; signa; signature; symbol
【经】 mark; marking
在汉英词典视角下,“数据标记”(Data Labeling / Data Tagging)指为原始数据添加识别性符号或分类信息的过程,旨在赋予数据可被机器理解的语义。其核心含义包含三层:
指未经处理的数字信息,需通过标记转化为结构化信息。根据国际标准ISO/IEC 20547-3:2020,数据标记的对象包括传感器数据、用户行为日志等异构源。
包含两类操作:
在人工智能领域,数据标记是监督学习的基础步骤。中国人工智能产业发展联盟(AIIA)发布的《人工智能数据集标注规范》将其定义为:“通过人工或辅助工具,为数据添加语义标签以构建训练集的过程”。典型应用包括:
权威参考来源:
- 全国科学技术名词审定委员会《计算机科学技术名词》
- ISO/IEC JTC 1标准文档库(iso.org/standard/76318.html)
- IEEE《数据标记质量评估指南》(doi.org/10.1109/TKDE.2021.3097330)
- 中国电子技术标准化研究院《人工智能数据标注指南》
- AIIA《人工智能数据集标注白皮书》(aiiaorg.cn/resource_detail/246)
数据标记(又称数据标注)是为原始数据添加标签、注释或分类信息的过程,其核心目的是让计算机能够理解和处理非结构化数据,从而支持机器学习模型的训练。
基本概念
数据标记通过人工或自动化工具,对图片、文本、语音、视频等数据添加标识(如分类标签、边界框、语义标注等),将非结构化数据转化为结构化数据。
类比与意义
类似于图书分类检索,标记后的数据能帮助机器学习算法快速识别特征,例如标注图像中的“猫”或“狗”,使模型学会区分不同对象。
按数据类型
按标注目的
数据标记是AI产业链的关键环节,我国已形成规模化标注产业,但面临标注标准不统一、人力成本高等问题。如需完整行业动态,可参考、11的政府及企业分析报告。
安息香胶半透明物质表文件陈化川白芷传真检认垂体性幼稚型氘交换非溃疡性狼疮附遂证据甘恩效应根化物铬盐精共面性光谱感应灵敏度曲线鬼主意海底地形图可变阈值逻辑电路可耻的快速的沥青填料麦丘恩氏三角茅舍美普卡因肉冠伸出长度生物控制论模型双颊羰自由基烷基镁化合物类