
【经】 coefficient of determination
确定系数(Coefficient of Determination,记作$R$)是统计学中用于量化回归模型解释变量与因变量之间关系强度的核心指标,其汉英对照定义可表述为:在回归分析中,确定系数表示自变量对因变量变动的解释比例,数值范围在$$之间,值越大表明模型拟合度越高。
确定系数由总平方和(SST)、回归平方和(SSR)及残差平方和(SSE)构成,计算公式为: $$ R = 1 - frac{SSE}{SST} $$ 其中$SSE = sum (y_i - hat{y}_i)$,$SST = sum (y_i - bar{y})$。该公式表明$R$反映模型对数据变异性的捕捉能力。
在实证研究中,$R$≥0.7通常认为模型具有强解释力,例如在经济学领域预测GDP时,若$R=0.85$,则说明85%的GDP波动可由模型变量解释。但需注意,高$R$并不必然代表因果关系成立,可能受变量共线性或过拟合影响。
由于$R$随自变量增加而单调上升,学术界常采用调整后确定系数(Adjusted $R$)进行修正,其公式引入自变量数量$k$和样本量$n$: $$ text{Adjusted } R = 1 - left( frac{n-1}{n-k-1} right)(1 - R) $$ 该指标更适用于多变量模型的比较。
参考来源:
确定系数(Coefficient of Determination),通常用 ( R )(R-squared)表示,是统计学中用于衡量回归模型对因变量(目标变量)变异解释能力的指标。以下是详细解释:
确定系数表示模型能解释的因变量变异占总变异的比例,取值范围为 ([0, 1]),计算公式为: $$ R = 1 - frac{SS{text{残差}}}{SS{text{总}}} $$ 其中:
解释能力:
与相关系数的联系:
变量增加导致虚高:
不反映因果关系:
忽略模型复杂度:
若某模型 ( R = 0.85 ),表示因变量 85% 的变异可由模型解释,剩余 15% 由未包含的变量或随机误差导致。
建议结合其他指标(如均方误差、显著性检验)综合评估模型质量。
【别人正在浏览】