
【化】 discriminant analysis
differentiate; distinguish
analyze; construe; analysis; assay
【計】 parser
【化】 analysis; assaying
【醫】 analysis; anslyze
【經】 analyse
判别分析(Discriminant Analysis)是一種統計學中的監督學習方法,用于根據已知類别的樣本數據建立分類模型,從而預測新樣本所屬的類别。其核心目标是通過尋找特征變量的線性組合(判别函數),最大化不同類别之間的差異,同時最小化同類内部的差異,實現對樣本的最優分類。
判别函數(Discriminant Function)
數學表達式為線性組合:
$$
D = b_0 + b_1X_1 + b_2X_2 + cdots + b_kX_k
$$
其中 (b_i) 為判别系數,(X_i) 為自變量。該函數将多維數據投影到低維空間,使類别分離度最大化。
費希爾準則(Fisher's Criterion)
由統計學家 R.A. Fisher 提出,通過最大化組間方差與組内方差的比值确定判别方向:
$$
J(mathbf{w}) = frac{mathbf{w}^T mathbf{S}_B mathbf{w}}{mathbf{w}^T mathbf{S}_W mathbf{w}}
$$
其中 (mathbf{S}_B) 為組間散度矩陣,(mathbf{S}_W) 為組内散度矩陣。
分類規則(Classification Rule)
基于馬氏距離(Mahalanobis Distance)或貝葉斯概率,将樣本分配到判别得分最接近的類别中心。
假設各類别協方差矩陣相同,適用于連續型自變量且數據近似正态分布。
允許不同類别有獨立協方差矩陣,靈活性更高但需更多樣本量支持。
通過引入正則化參數平衡 LDA 與 QDA 的偏差與方差。
通過財務指标判别企業信用等級(如違約/非違約)。
基于基因表達數據分類疾病亞型(例:癌症分型診斷)。
根據消費行為特征劃分客戶群體(如高/低價值用戶)。
(經典文獻,首次提出判别分析思想)
(教材第11章系統闡述LDA/QDA理論與案例)
(第4章詳解判别分析在機器學習中的應用)
注:因未搜索到可驗證的線上資源鍊接,以上引用僅标注文獻來源。建議通過學術數據庫(如JSTOR、SpringerLink)獲取原文。
判别分析(Discriminant Analysis)是一種統計學方法,主要用于根據已知類别的數據建立分類模型,從而将新的觀測樣本劃分到特定類别中。其核心思想是通過分析數據特征,找到能夠最大程度區分不同類别的規則或函數。
基本目标
通過構建判别函數(線性或非線性),将多維數據投影到低維空間,使不同類别的樣本盡可能分離,同時同一類别内的樣本盡可能聚集。例如,費舍爾線性判别分析(LDA)通過最大化類間方差與類内方差的比值來确定最佳投影方向。
與聚類分析的區别
判别分析屬于監督學習(需已知類别标籤),而聚類分析屬于無監督學習(無需先驗類别)。
線性判别分析(LDA)
二次判别分析(QDA)
其他變體
如正則化判别分析(RDA)、靈活判别分析(FDA)等,用于處理高維數據或複雜分布。
氨磺酰苯甲酸安眠劑膀胱照片爆轟速率産生式語言乘人之危蛋白過少的點菜電力工業部電子發射電流非經常損益關節矽乳石國民收入的稅收彈性行動步驟化學反應呼叫識别符混合散光與主要近視擴充控制語言羅海因氏裂體吸蟲夢樣狀态逆查法平刮闆模型商船船員審計目标石棉塵肺試探性路由選擇收款日期樹脂型增塑劑頭孢替唑