
【化】 discriminant analysis
differentiate; distinguish
analyze; construe; analysis; assay
【计】 parser
【化】 analysis; assaying
【医】 analysis; anslyze
【经】 analyse
判别分析(Discriminant Analysis)是一种统计学中的监督学习方法,用于根据已知类别的样本数据建立分类模型,从而预测新样本所属的类别。其核心目标是通过寻找特征变量的线性组合(判别函数),最大化不同类别之间的差异,同时最小化同类内部的差异,实现对样本的最优分类。
判别函数(Discriminant Function)
数学表达式为线性组合:
$$
D = b_0 + b_1X_1 + b_2X_2 + cdots + b_kX_k
$$
其中 (b_i) 为判别系数,(X_i) 为自变量。该函数将多维数据投影到低维空间,使类别分离度最大化。
费希尔准则(Fisher's Criterion)
由统计学家 R.A. Fisher 提出,通过最大化组间方差与组内方差的比值确定判别方向:
$$
J(mathbf{w}) = frac{mathbf{w}^T mathbf{S}_B mathbf{w}}{mathbf{w}^T mathbf{S}_W mathbf{w}}
$$
其中 (mathbf{S}_B) 为组间散度矩阵,(mathbf{S}_W) 为组内散度矩阵。
分类规则(Classification Rule)
基于马氏距离(Mahalanobis Distance)或贝叶斯概率,将样本分配到判别得分最接近的类别中心。
假设各类别协方差矩阵相同,适用于连续型自变量且数据近似正态分布。
允许不同类别有独立协方差矩阵,灵活性更高但需更多样本量支持。
通过引入正则化参数平衡 LDA 与 QDA 的偏差与方差。
通过财务指标判别企业信用等级(如违约/非违约)。
基于基因表达数据分类疾病亚型(例:癌症分型诊断)。
根据消费行为特征划分客户群体(如高/低价值用户)。
(经典文献,首次提出判别分析思想)
(教材第11章系统阐述LDA/QDA理论与案例)
(第4章详解判别分析在机器学习中的应用)
注:因未搜索到可验证的在线资源链接,以上引用仅标注文献来源。建议通过学术数据库(如JSTOR、SpringerLink)获取原文。
判别分析(Discriminant Analysis)是一种统计学方法,主要用于根据已知类别的数据建立分类模型,从而将新的观测样本划分到特定类别中。其核心思想是通过分析数据特征,找到能够最大程度区分不同类别的规则或函数。
基本目标
通过构建判别函数(线性或非线性),将多维数据投影到低维空间,使不同类别的样本尽可能分离,同时同一类别内的样本尽可能聚集。例如,费舍尔线性判别分析(LDA)通过最大化类间方差与类内方差的比值来确定最佳投影方向。
与聚类分析的区别
判别分析属于监督学习(需已知类别标签),而聚类分析属于无监督学习(无需先验类别)。
线性判别分析(LDA)
二次判别分析(QDA)
其他变体
如正则化判别分析(RDA)、灵活判别分析(FDA)等,用于处理高维数据或复杂分布。
鼻塞测压计不翼而飞乘积法则初级计算机操作员除纤颤典当著定位信标放射性示踪剂蜂蜜酒浮头式换热器干法后处理高低点法购买授权书鼓窦炎环形色谱法回复权利混附射气积分分布曲线决明子髋关节罗丁醛卖价判徒琼斯还原管全同立构双态操作输尿管缝术酸性氧化物糖色填鸭式教育