
【计】 supervised learning
监督学习(Supervised Learning)是机器学习领域中基于标注数据训练模型的核心范式。其核心定义为:通过输入变量(input variables)与已知输出变量(output variables)的对应关系,构建从输入到输出的映射函数,最终实现对新数据的预测或分类。在汉英词典视角下,该术语对应英文“Supervised Learning”,其中“监督”指代训练过程中标注数据(labeled data)对模型的指导作用。
从技术实现角度,监督学习包含三大核心要素:
在实际应用中,监督学习支撑了包括图像分类(ImageNet数据集)、自然语言处理(BERT模型)等突破性技术发展。斯坦福大学《CS229机器学习课程》将其定位为“现代人工智能系统的基石”。值得注意的是,标注数据的质量直接影响模型性能,行业实践中常采用数据清洗(Data Cleaning)和增强(Augmentation)提升数据有效性。
监督学习是机器学习中最基础且应用最广泛的方法之一,其核心是通过带有标签的数据训练模型,使模型能够根据输入数据预测对应的输出结果。以下是详细解释:
监督学习(Supervised Learning)是指从已标注的数据集中学习输入(特征)与输出(标签)之间的映射关系。每个训练样本包含输入变量(如身高、体重)和对应的目标输出(如性别、疾病风险),模型的目标是学习这种关系,从而对未知数据做出准确预测。
监督学习主要解决两类问题:
分类(Classification)
预测离散的类别标签,例如:
回归(Regression)
预测连续的数值结果,例如:
训练阶段:
预测阶段:
训练后的模型接收新输入数据,根据学习到的映射关系输出预测结果。例如:输入患者症状,输出疾病概率。
优点:
缺点:
监督学习通过“教”模型如何从已知答案中学习规律,广泛应用于现实世界的预测任务。其成功依赖于高质量的数据和合适的算法选择。后续学习中可进一步探索无监督学习(无标签数据)和半监督学习(部分标签数据)等其他范式。
表驱动模拟催汗的电流电池法伯缺陷放电聚合法分配证书光比色计故障敏感程序后脑突出畸胎甲酰甲硫氨酸寄存器名掠过硫醛描界器迷路性聋纳税后收入平稳汽化升压阀禽冠蚤奇偶模分析圈绕法人工后天免疫软腭麻痹声光玻璃生铁事实双电子锅糖块外服的