外观
机器学习的三大视角
约 1121 字大约 4 分钟
2025-03-04
一、学习任务视角(What to Learn)
1. 任务定义与典型算法
任务类型 | 简短描述 | 典型算法 |
---|---|---|
分类 | 将数据划分到预定义类别(离散标签预测) | 支持向量机(SVM)、决策树、随机森林、神经网络 |
回归 | 预测连续数值结果(连续值预测) | 线性回归、支持向量回归(SVR)、随机森林回归、神经网络 |
聚类 | 发现数据内在结构,无监督分组 | K-means、层次聚类、DBSCAN、高斯混合模型(GMM) |
降维 | 压缩高维数据保留核心信息 | 主成分分析(PCA)、t-SNE、线性判别分析(LDA)、自编码器 |
排名 | 对数据进行有序排列(相关性排序) | 排序支持向量机(RankSVM)、LambdaMART、ListNet |
密度估计 | 构建数据分布概率模型 | 核密度估计(KDE)、高斯混合模型(GMM)、变分自编码器(VAE) |
优化 | 提升系统性能参数(寻找最优解) | 梯度下降法、遗传算法、粒子群优化、贝叶斯优化 |
2. 任务特征
- 输入输出关系:分类/回归属于预测类任务,聚类/降维属于探索类任务
- 数据依赖:分类需标注数据,聚类依赖数据内在相似性
- 工业应用:京东物流通过分类任务优化快递分拣,准确率达98%
二、学习范式视角(How to Learn)
1. 基本范式分类
学习范式描述数据与知识获取的交互方式,构成算法设计方法论:
范式类型 | 数据特征 | 典型算法 | 应用场景 |
---|---|---|---|
监督学习 | 带标签数据驱动(输入-输出对) | SVM、决策树、神经网络 | 医疗诊断、信用评分 |
无监督学习 | 无标签数据自主探索 | K-means、自编码器 | 市场细分、基因序列分析 |
强化学习 | 环境交互获取奖励信号 | Q-learning、策略梯度 | 机器人控制、游戏AI |
半监督学习 | 混合标注与未标注数据 | 直推学习、图半监督 | 医学影像分析(标注成本高) |
2. 范式演进
- 多模态融合:结合视觉-语言跨模态数据(如DALL·E图像生成)
- 联邦学习:分散数据协同训练(如多医院联合疾病模型)
- 在线学习:动态更新模型参数(如新闻推荐系统实时优化)
三、学习模型视角(How to Model)
1. 模型类型划分
学习模型是实现学习任务的数学工具,可分为四大方法论:
- 几何模型:基于空间距离度量(如KNN、SVM超平面划分)
- 概率模型:基于统计分布建模(如朴素贝叶斯、隐马尔可夫链)
- 逻辑模型:基于规则推理系统(如专家系统、决策树)
- 网络模型:基于神经元连接(如CNN、Transformer)
2. 现代模型突破
- 神经符号系统:融合CNN特征提取与符号推理(如AlphaFold蛋白质结构预测)
- 图神经网络:通过随机游走和谱域滤波处理图结构数据(社交网络分析)
- 元学习模型:实现"学会学习"的通用框架(如MAML小样本学习)
四、三维视角的协同作用
1. 方法论融合
- 任务驱动模型选择:图像分类任务需CNN模型(网络视角)+监督学习范式+分类任务定义
- 工业实践案例:特斯拉自动驾驶系统整合强化学习范式(环境交互)+几何模型(路径规划)+回归任务(速度预测)
2. 发展前沿
- 可解释性增强:通过SHAP值解释神经网络决策过程(医疗领域可信AI)
- 量子机器学习:量子退火算法优化组合问题(如D-Wave物流路径规划)
- 认知科学启发:类比人类学习机制设计课程学习框架(渐进式难度训练)
五、总结
三个视角构成机器学习的完整方法论体系——学习任务定义问题边界,学习范式确定知识获取方式,学习模型提供数学实现工具。其协同演进推动着从专用AI向通用AI的跨越,如GPT-4通过Transformer模型(网络视角)整合多任务学习能力,在文本生成、代码编写等跨领域任务中展现惊人泛化能力。
版权所有
版权归属:NateHHX