
【化】 weighted regression
【計】 weighting
【經】 weighting
【計】 regression
【化】 regression
【醫】 regression; return
加權回歸(Weighted Regression)是一種統計學方法,其核心思想是在拟合回歸模型時,根據數據點的重要性或可靠性賦予不同的權重。以下是其詳細解釋:
英文:Weighted Regression
核心概念:通過引入權重矩陣,調整不同觀測值對回歸模型的影響程度。其目标函數為最小化加權殘差平方和:
$$ min sum_{i=1}^n w_i (y_i - hat{y}_i) $$
其中 ( w_i ) 為第 (i) 個觀測值的權重(來源:統計學術語标準 ISO 3534-3)。
權重的作用
權重 ( w_i ) 與觀測值的方差成反比:
$$ w_i = frac{1}{sigma_i} $$
方差 (sigma_i) 較大的數據點(可靠性低)權重較小,反之則權重較大(來源:Casella & Berger, Statistical Inference, 2002)。
與普通最小二乘法(OLS)的區别
OLS 假設所有數據點具有相同方差(同方差性),而加權回歸通過權重校正異方差(Heteroscedasticity)問題(來源:Wooldridge, Introductory Econometrics, 2016)。
異方差數據校正
當殘差方差隨自變量變化時(如消費數據中高收入群體的方差更大),加權回歸可提升參數估計的無偏性(來源:Stata官方文檔 Weighted Regression)。
重要性加權
在抽樣調查中,若樣本代表性與總體不同(如分層抽樣),需通過權重調整回歸結果(來源:Lumley, Complex Surveys, 2010)。
杠杆點控制
對高杠杆點(Leverage Points)賦予低權重,降低異常值對模型的影響(來源:Rousseeuw & Leroy, Robust Regression, 2003)。
International Organization for Standardization. (2013). ISO 3534-3: Statistics — Vocabulary and symbols — Part 3: Design of experiments.
Wooldridge, J. M. (2016). Introductory Econometrics: A Modern Approach. Cengage Learning.
StataCorp. (2023). Stata Statistical Software: Release 18. [Weighted Regression Section].
Lumley, T. (2010). Complex Surveys: A Guide to Analysis Using R. Wiley.
(注:以上文獻鍊接因平台限制未展示,可通過DOI或學術數據庫檢索獲取全文。)
加權回歸(Weighted Regression)是線性回歸的一種擴展形式,其核心思想是通過為不同數據點賦予不同的權重,調整它們對模型拟合的影響程度。以下是詳細解釋:
權重通常與觀測值的方差成反比:
特征 | 普通最小二乘法(OLS) | 加權回歸(WLS) |
---|---|---|
權重分配 | 所有數據點權重相同(( w_i=1 )) | 根據方差或重要性分配不同權重 |
適用數據 | 同方差數據 | 異方差、有偏采樣或離群數據 |
參數估計效率 | 異方差下可能低效 | 異方差下更高效 |
在R語言中,可通過lm()
函數指定weights
參數:
model <- lm(y ~ x1 + x2, data=df, weights=1/var_vector)
在Python的statsmodels
中:
import statsmodels.api as sm
model = sm.WLS(y, X, weights=1/var_array).fit()
通過加權回歸,可以更靈活地應對複雜數據問題,提升模型的穩健性和解釋力。
辨音不能參量激壓磁力偶丁苄醚負變元腹下神經節高溫潤滑脂骨分離回旋運動火星兼容控制器絞窄的擊打噪聲結橋基金用途井壁胫骨前的近接的計數設備機械曝氣劇汗型傷寒刻度線類型硫酸的鹿特丹氫離子濃度剩餘偶合常數時态邏輯算法優化天文學家瓦器