
【計】 flag data
mark; sign; symbol; badge; earmark; tag
【計】 badge; benchmarking; F; L; labelling; marker; sentinel; tag; tagging
【化】 code; mark; marks; stamping; tag; tagging
【醫】 labelling; Sig.; signa; signature; symbol
【經】 mark; marking
data
【計】 D; data
【化】 data
【經】 data; datum; figure; quantitative data
在漢英詞典視角下,“标記數據”(Biāojì Shùjù)指為原始數據添加特定标籤或注釋的過程及結果,旨在賦予數據可被機器識别的語義信息。其核心含義包含以下層面:
動詞含義(标記/數據标注)
指人工或算法對原始數據(如文本、圖像、音頻)添加分類标籤的過程。英文對應“Tagging Data” 或“Labeling Data”,例如為圖像中的物體标注“貓”“汽車”等類别标籤。據《牛津英語詞典》定義,标籤(Label)是“用于識别或分類信息的标識符”(Oxford English Dictionary, "Label"詞條)。
名詞含義(已标記的數據集)
指完成标注後形成的結構化數據集,英文稱“Tagged Data” 或“Labeled Data”。此類數據包含特征(如圖像像素)和對應标籤(如“狗”),是監督學習的基礎。劍橋詞典将“Tagged”解釋為“附加了識别信息的”(Cambridge Dictionary, "Tagged"詞條)。
在機器學習領域,标記數據通過提供監督信號訓練模型。例如:
學術定義
根據《人工智能:現代方法》(Russell & Norvig),标記數據是“包含輸入特征與目标輸出配對的數據集”,用于建立輸入到輸出的映射關系(第5版,第702頁)。
行業标準
國際數據管理協會(DAMA)将數據标記定義為“通過元數據增強數據語義的過程”,強調其提升數據可解釋性的作用(DAMA-DMBOK, 2nd Edition)。
标記數據支撐關鍵AI應用,如:
權威來源鍊接:
标記數據(Data Annotation/Labeling)是指通過人工或自動化方式為原始數據添加分類、注釋或标籤的過程,使其能夠被計算機系統識别和學習。以下是詳細解釋:
技術基礎
标記數據是計算機視覺(CV)和自然語言處理(NLP)的關鍵預處理步驟。通過标注圖像、文本或視頻的特征(如物體邊界框、情感分類等),數據被轉化為機器可理解的格式,從而訓練AI模型識别規律。
應用領域
常見形式
實施過程
通常依賴人工标注員對數據進行精細化處理,例如标注醫療影像中的病竈區域,或為語音片段添加文字轉錄。
如需進一步了解具體标注案例或技術細節,可參考騰訊雲開發者社區等專業來源。
波瓣穿透碘苯酯癫痫代症刁番圖的多欄式工作底稿多染性筏夫格-巴二氏綜合征功能器件管理試驗過熱器恒重合用線回流式幹燥器火絨蕈莢迷醇加強預防作用假脫機輸出文件機會主義零配件清單蜜露偶然的行為乳化填充塔山道年萜烯四鹵代苯蘇格蘭的條痕狀的脫軌器外圍總線