
美:/'aʊtˈlaɪərz/
n. 离开本体的东西;老围层;异常值,离群值(outlier 的复数)
These records are called outliers.
这些记录称为离群值。
Identify potential skew and outliers.
识别潜在的歪斜和异常值。
The result also warns about outliers.
结果还指出出现了离群值。
There are always outliers .
总会有个例存在的。
There are always outliers.
总是会有例外的。
在统计学和数据分析领域,异常值(Outliers) 指数据集中与其他观测值显著偏离的数据点。它们可能由测量误差、数据录入错误、自然变异或特殊事件引起,对分析结果有潜在影响。
统计定义
异常值是与数据整体分布模式明显不符的观测值。例如,在正态分布中,通常将超出均值±3个标准差范围的数据视为异常值。
公式示例:
$$ text{异常值判定条件:} text{若 } |x_i - mu| > 3sigma $$ 其中 $mu$ 为均值,$sigma$ 为标准差。
来源:美国国家标准技术研究院(NIST)《工程统计学手册》[1]。
成因分类
来源:澳大利亚统计局《统计概念解析》[2]。
机器学习
异常值可能扭曲模型训练,导致预测偏差。例如,在房价预测中,少量豪宅数据可能使线性回归模型高估普通住宅价格。
来源:斯坦福大学CS229课程笔记[3]。
金融风控
信用卡交易中的异常值可识别欺诈行为(如突然出现的高额境外消费)。
来源:Investopedia金融百科[4]。
质量管理
制造业通过监控生产数据中的异常值发现设备故障(如零件尺寸突然超差)。
来源:美国质量协会(ASQ)案例库[5]。
来源:英国医学期刊(BMJ)研究指南[6]。
"Outliers" 是一个多领域通用的术语,主要含义是与主体数据、群体或常规明显偏离的异常个体或现象。具体解释如下:
在统计学中,outliers(异常值)指数据集中与其他观测值显著不同的数值。例如:
在社会科学或日常语境中,outliers 指行为、观点或特征与群体不符的人或现象:
如果需进一步了解具体案例或技术方法,可结合实际场景提供更针对性的解释。
【别人正在浏览】