
【化】 weighted regression
【计】 weighting
【经】 weighting
【计】 regression
【化】 regression
【医】 regression; return
加权回归(Weighted Regression)是一种统计学方法,其核心思想是在拟合回归模型时,根据数据点的重要性或可靠性赋予不同的权重。以下是其详细解释:
英文:Weighted Regression
核心概念:通过引入权重矩阵,调整不同观测值对回归模型的影响程度。其目标函数为最小化加权残差平方和:
$$ min sum_{i=1}^n w_i (y_i - hat{y}_i) $$
其中 ( w_i ) 为第 (i) 个观测值的权重(来源:统计学术语标准 ISO 3534-3)。
权重的作用
权重 ( w_i ) 与观测值的方差成反比:
$$ w_i = frac{1}{sigma_i} $$
方差 (sigma_i) 较大的数据点(可靠性低)权重较小,反之则权重较大(来源:Casella & Berger, Statistical Inference, 2002)。
与普通最小二乘法(OLS)的区别
OLS 假设所有数据点具有相同方差(同方差性),而加权回归通过权重校正异方差(Heteroscedasticity)问题(来源:Wooldridge, Introductory Econometrics, 2016)。
异方差数据校正
当残差方差随自变量变化时(如消费数据中高收入群体的方差更大),加权回归可提升参数估计的无偏性(来源:Stata官方文档 Weighted Regression)。
重要性加权
在抽样调查中,若样本代表性与总体不同(如分层抽样),需通过权重调整回归结果(来源:Lumley, Complex Surveys, 2010)。
杠杆点控制
对高杠杆点(Leverage Points)赋予低权重,降低异常值对模型的影响(来源:Rousseeuw & Leroy, Robust Regression, 2003)。
International Organization for Standardization. (2013). ISO 3534-3: Statistics — Vocabulary and symbols — Part 3: Design of experiments.
Wooldridge, J. M. (2016). Introductory Econometrics: A Modern Approach. Cengage Learning.
StataCorp. (2023). Stata Statistical Software: Release 18. [Weighted Regression Section].
Lumley, T. (2010). Complex Surveys: A Guide to Analysis Using R. Wiley.
(注:以上文献链接因平台限制未展示,可通过DOI或学术数据库检索获取全文。)
加权回归(Weighted Regression)是线性回归的一种扩展形式,其核心思想是通过为不同数据点赋予不同的权重,调整它们对模型拟合的影响程度。以下是详细解释:
权重通常与观测值的方差成反比:
特征 | 普通最小二乘法(OLS) | 加权回归(WLS) |
---|---|---|
权重分配 | 所有数据点权重相同(( w_i=1 )) | 根据方差或重要性分配不同权重 |
适用数据 | 同方差数据 | 异方差、有偏采样或离群数据 |
参数估计效率 | 异方差下可能低效 | 异方差下更高效 |
在R语言中,可通过lm()
函数指定weights
参数:
model <- lm(y ~ x1 + x2, data=df, weights=1/var_vector)
在Python的statsmodels
中:
import statsmodels.api as sm
model = sm.WLS(y, X, weights=1/var_array).fit()
通过加权回归,可以更灵活地应对复杂数据问题,提升模型的稳健性和解释力。
巴克尔炼钠法半定位苯并坚牢橙变产收益蚕豆蚕蛹油程序设计语句嗔染器船舶建造保险单出口托收电气玻璃绝缘匐行的附属记录梗观察数据含碘胨灰尘计数加速通风进入租地权计算机业余爱好者可逆转动买卖面肌麻痹磨擦联结器强制执行判决的程序亲合标记气升式发酵罐水獭皮苏打粒塔内淤渣