
【計】 secondary sample; subsampling
二次抽樣(二次抽樣)是統計學和數據分析中的常用方法,英文對應"subsampling"或"secondary sampling",指在已獲取的初始樣本基礎上進行再次抽樣。該術語在質量控制、機器學習和大數據分析領域具有特定應用場景。
從操作流程看,二次抽樣需遵循兩個核心步驟:
該方法的核心價值體現在:
在工業質量控制領域,美國國家标準與技術研究院(NIST)建議二次抽樣比例不超過原始樣本的30%,以确保統計結果的有效性。而在生物統計學中,約翰霍普金斯大學研究指出該方法可有效處理基因測序數據的維度災難問題。
當前學術界對二次抽樣的數學表達通常采用以下形式: $$ s{sub} = frac{1}{k}sum{i=1}^{k} x_{tau(i)} $$ 其中$tau(i)$表示從原始樣本中抽取的索引,$k$為子樣本容量。這種表達方式被收錄于《Springer統計學百科全書》最新修訂版。
二次抽樣(也稱雙次抽樣)是一種分階段判斷産品質量或總體情況的抽樣檢驗方法,廣泛應用于質量控制和統計調查領域。其核心特點是通過最多兩次抽樣,結合累計結果做出最終判定。
基本概念
二次抽樣方案包含五個參數:$N$(批量大小)、$n_1$(第一次樣本量)、$n_2$(第二次樣本量)、$C_1$(第一次合格判定數)、$C_2$(第二次累計合格判定數)。例如方案 $(N, n_1, n_2, C_1, C_2)$。
判定流程
質量控制
適用于檢驗成本較高或破壞性測試的場景,如工業産品抽檢。通過分階段減少平均樣本量,平衡檢驗效率與準确性。
統計調查
當第一次樣本代表性不足時(如輿論調查),二次抽樣可提高推斷準确性,第二次樣本量可靈活調整。
實驗室檢測
在理化或微生物檢測中,二次抽樣用于從原始樣品中分取測試樣,需确保分樣過程無污染且标識清晰。
對比項 | 一次抽樣 | 二次抽樣 |
---|---|---|
抽樣次數 | 僅1次 | 最多2次 |
判定效率 | 簡單但樣本量固定 | 可能減少平均樣本量 |
靈活性 | 較低(僅1個判定數) | 較高(分階段判定) |
一次抽樣的接收概率公式:
$$
Pa = sum{d=0}^{C} frac{{Np choose d} {N(1-p) choose n-d}}{{N choose n}}
$$
二次抽樣則需分階段計算,涉及兩次抽樣的聯合概率。
如需了解具體行業标準(如GB/T 2828計數抽樣程式),可進一步查閱專業文獻或質檢規範。
【别人正在浏覽】