外观
机器学习模型
约 783 字大约 3 分钟
2025-03-09
一、机器学习模型的定义
机器学习模型是通过数据训练得到的数学函数或规则集合,用于从输入数据中提取特征并完成预测、分类或决策任务。其本质是建立输入变量(特征)与输出变量(标签)之间的映射关系,根据学习目标和数据特性可分为监督模型(如分类、回归)、无监督模型(如聚类、降维)和强化学习模型等。
二、四大模型类型及经典算法对比
Models 模型 | Brief Statements 简短描述 | Sub - models 子模型 | Typical Algorithm 典型算法 |
---|---|---|---|
Probabilistic 概率 | Use probabilistic models to denote the conditional dependence between random variables. 采用概率模式来表示随机变量之间的条件相关性 | Bayes 贝叶斯 Generative 生成 Statistic 统计 | Bayesian Network 贝叶斯网络 Probabilistic Programming 概率规划 Linear Regression 线性回归 |
Geometric 几何 | Use geometric models such as line, plane, distance or manifold to construct learning algorithms. 采用线、面、距离或流形等几何图形模型来构建学习算法 | Line 线 Plane 面 Distance 距离 Manifold 流形 | Linear Regression 线性回归 SVM 支持向量机 k-NN k-近邻 Isomap 等距映射 |
Logical 逻辑 | Use logical models to construct learning algorithms. 采用逻辑模型来构建学习算法 | Logic 逻辑 Rule 规则 | Inductive Logic Program. 归纳逻辑编程 Association Rule 关联规则 |
Networked 网络 | Use networked models to construct learning algorithms. 采用网络模式构建机器学习算法 | Shallow 浅层 Deep 深层 | Perceptron 感知机 CNN 卷积神经网络 |
各模型特点及应用场景
概率模型
- 核心特点:通过联合概率分布或条件概率分布建模,适用于不确定性推理。
- 应用:文本分类(朴素贝叶斯)、语音识别(HMM)、生物基因序列分析(贝叶斯网络)。
几何模型
- 核心特点:依赖距离度量和空间划分,通过核方法处理非线性可分问题。
- 应用:手写数字识别(SVM)、客户分群(K-Means)、基因表达可视化(t-SNE)。
逻辑模型
- 核心特点:基于信息增益或基尼系数构建规则树,可解释性强。
- 应用:金融风控(随机森林)、商品推荐(Apriori)、医疗诊断(决策树)。
网络模型
- 核心特点:端到端自动特征提取,支持大规模并行计算。
- 应用:图像识别(CNN)、时序预测(LSTM)、社交网络分析(GCN)。
三、总结
- 概率模型:适用于医学诊断、自然语言处理等需要概率推理的场景。
- 几何模型:在图像分类、数据聚类等空间划分任务中表现突出。
- 逻辑模型:在金融和医疗领域因其可解释性广受欢迎。
- 网络模型:推动计算机视觉和自然语言处理的突破,处理高维复杂数据。
技术演进:混合模型(如概率图模型结合神经网络)成为趋势,融合可解释性与高性能。
版权所有
版权归属:NateHHX