
【计】 secondary sample; subsampling
二次抽样(二次抽样)是统计学和数据分析中的常用方法,英文对应"subsampling"或"secondary sampling",指在已获取的初始样本基础上进行再次抽样。该术语在质量控制、机器学习和大数据分析领域具有特定应用场景。
从操作流程看,二次抽样需遵循两个核心步骤:
该方法的核心价值体现在:
在工业质量控制领域,美国国家标准与技术研究院(NIST)建议二次抽样比例不超过原始样本的30%,以确保统计结果的有效性。而在生物统计学中,约翰霍普金斯大学研究指出该方法可有效处理基因测序数据的维度灾难问题。
当前学术界对二次抽样的数学表达通常采用以下形式: $$ s{sub} = frac{1}{k}sum{i=1}^{k} x_{tau(i)} $$ 其中$tau(i)$表示从原始样本中抽取的索引,$k$为子样本容量。这种表达方式被收录于《Springer统计学百科全书》最新修订版。
二次抽样(也称双次抽样)是一种分阶段判断产品质量或总体情况的抽样检验方法,广泛应用于质量控制和统计调查领域。其核心特点是通过最多两次抽样,结合累计结果做出最终判定。
基本概念
二次抽样方案包含五个参数:$N$(批量大小)、$n_1$(第一次样本量)、$n_2$(第二次样本量)、$C_1$(第一次合格判定数)、$C_2$(第二次累计合格判定数)。例如方案 $(N, n_1, n_2, C_1, C_2)$。
判定流程
质量控制
适用于检验成本较高或破坏性测试的场景,如工业产品抽检。通过分阶段减少平均样本量,平衡检验效率与准确性。
统计调查
当第一次样本代表性不足时(如舆论调查),二次抽样可提高推断准确性,第二次样本量可灵活调整。
实验室检测
在理化或微生物检测中,二次抽样用于从原始样品中分取测试样,需确保分样过程无污染且标识清晰。
对比项 | 一次抽样 | 二次抽样 |
---|---|---|
抽样次数 | 仅1次 | 最多2次 |
判定效率 | 简单但样本量固定 | 可能减少平均样本量 |
灵活性 | 较低(仅1个判定数) | 较高(分阶段判定) |
一次抽样的接收概率公式:
$$
Pa = sum{d=0}^{C} frac{{Np choose d} {N(1-p) choose n-d}}{{N choose n}}
$$
二次抽样则需分阶段计算,涉及两次抽样的联合概率。
如需了解具体行业标准(如GB/T 2828计数抽样程序),可进一步查阅专业文献或质检规范。
变动费用扁桃体边序列鼻外静脉步序购买超过规定时间的工作承担者枞香胶仿效的风雅地钙缺失供风过冷器后圆线虫属或多或少条款颈动脉鞘抗硫胺素联邦储备城市链霉素B领班零星吸引力氯化一氯三氨络亚铂派特逊氏综合征日本马皮疽熔铁炉体上颌牙槽管石墨水浆嗜污的王玺保管官