
【計】 data marker
data
【計】 D; data
【化】 data
【經】 data; datum; figure; quantitative data
mark; sign; symbol; badge; earmark; tag
【計】 badge; benchmarking; F; L; labelling; marker; sentinel; tag; tagging
【化】 code; mark; marks; stamping; tag; tagging
【醫】 labelling; Sig.; signa; signature; symbol
【經】 mark; marking
在漢英詞典視角下,“數據标記”(Data Labeling / Data Tagging)指為原始數據添加識别性符號或分類信息的過程,旨在賦予數據可被機器理解的語義。其核心含義包含三層:
指未經處理的數字信息,需通過标記轉化為結構化信息。根據國際标準ISO/IEC 20547-3:2020,數據标記的對象包括傳感器數據、用戶行為日志等異構源。
包含兩類操作:
在人工智能領域,數據标記是監督學習的基礎步驟。中國人工智能産業發展聯盟(AIIA)發布的《人工智能數據集标注規範》将其定義為:“通過人工或輔助工具,為數據添加語義标籤以構建訓練集的過程”。典型應用包括:
權威參考來源:
- 全國科學技術名詞審定委員會《計算機科學技術名詞》
- ISO/IEC JTC 1标準文檔庫(iso.org/standard/76318.html)
- IEEE《數據标記質量評估指南》(doi.org/10.1109/TKDE.2021.3097330)
- 中國電子技術标準化研究院《人工智能數據标注指南》
- AIIA《人工智能數據集标注白皮書》(aiiaorg.cn/resource_detail/246)
數據标記(又稱數據标注)是為原始數據添加标籤、注釋或分類信息的過程,其核心目的是讓計算機能夠理解和處理非結構化數據,從而支持機器學習模型的訓練。
基本概念
數據标記通過人工或自動化工具,對圖片、文本、語音、視頻等數據添加标識(如分類标籤、邊界框、語義标注等),将非結構化數據轉化為結構化數據。
類比與意義
類似于圖書分類檢索,标記後的數據能幫助機器學習算法快速識别特征,例如标注圖像中的“貓”或“狗”,使模型學會區分不同對象。
按數據類型
按标注目的
數據标記是AI産業鍊的關鍵環節,我國已形成規模化标注産業,但面臨标注标準不統一、人力成本高等問題。如需完整行業動态,可參考、11的政府及企業分析報告。
白金的鼻緣布雷特規則次螺旋闆電平調節滴注輸液多元共晶結晶發工資隔膜式泵更年後的規定的類型國界過熱水合速度劃線金工賴百當油量力器馬克思主義法學家滅蟻腙諾模圖平黴素平穩值齊格勒-納塔聚合氣腔形成擾動潤滑浴探囊取物套壁