外观
岗位
约 979 字大约 3 分钟
2025-06-09
概述
大模型生态中的 11 大核心岗位,涵盖从数据采集、算法研发到部署运维、应用落地以及硬件支持的全产业链,帮助读者快速了解各类角色定位、典型职责与技能要求。
岗位一览
序号 | 名称 | 职责 | 技能要求 |
---|---|---|---|
1 | 数据工程师(大模型方向) | 负责大模型训练数据的采集、清洗、标注及数据集构建。例如:在医疗领域构建疾病知识图谱时,需通过临床指南和病历数据设计标注规则,支持垂直领域模型训练(如IBM Watson Health的医疗知识图谱)。 | 熟悉数据标注工具链、SQL/Python数据处理、数据质量评估方法,了解NLP/CV领域的数据格式标准。 |
2 | 模型研发工程师 | 主导基座大模型(如GPT-3、BERT)的架构设计与训练优化。例如:Meta开源的Llama系列模型通过改进Transformer架构降低训练成本。 | 掌握PyTorch/TensorFlow框架、分布式训练技术(如ZeRO优化)、模型蒸馏/剪枝方法,熟悉前沿论文复现。 |
3 | 算法工程师(微调方向) | 针对垂直领域进行模型微调。例如:医疗领域使用LoRA技术微调BERT生成诊断模型(如平安好医生的问诊助手),金融领域通过Adapter适配风控模型(如蚂蚁集团的风险识别系统)。 | 精通LoRA/Adapter微调技术、领域知识融合(如医疗流程建模)、模型评估与迭代优化。 |
4 | 评测工程师 | 制定多维评测指标并分析模型边界。例如:HuggingFace Evaluate工具支持自动化评测(如BLEU、ROUGE指标),用于评估生成式AI的摘要能力(如SummarizeBot)。 | 掌握自动化评测工具、统计分析方法,具备法律/伦理知识设计合规测试用例。 |
5 | 部署开发工程师 | 解决大模型推理部署难题。例如:电商平台通过TensorRT加速实现毫秒级推荐响应(如京东的实时商品推荐系统)。 | 熟悉GPU集群配置、模型压缩(ONNX)、低延迟框架(如Triton推理服务)。 |
6 | 应用开发工程师 | 集成大模型至业务场景。例如:智能客服场景基于LangChain开发Agent(如阿里小蜜),文档处理场景使用RAG优化摘要生成(如Notion AI)。 | 掌握LangChain/RAG技术、API集成能力、用户交互设计。 |
7 | 硬件架构师(AI方向) | 设计适配大模型的硬件方案。例如:华为昇腾AI芯片通过异构计算架构优化大模型推理效率。 | 熟悉芯片指令集(如NPU/GPU)、CUDA加速库、算力利用率优化策略。 |
8 | 大模型项目经理 | 统筹跨部门资源推动项目落地。例如:金融企业微调大模型用于风控时,需协调算法团队与合规部门(如招商银行的智能风控项目)。 | 熟悉敏捷开发流程、技术风险评估、行业落地场景分析。 |
9 | 大模型产品经理 | 将需求转化为技术方案。例如:智能写作工具(如Grammarly)通过分析用户行为优化模型迭代路径。 | 理解模型能力边界、ROI评估方法、场景化解决方案设计。 |
10 | 安全与合规专家 | 确保模型输出符合法规。例如:抖音的内容审核系统通过对抗样本检测过滤敏感信息。 | 熟悉GDPR/AI法案、数据脱敏技术、内容审核系统设计。 |
11 | 运维工程师(AI方向) | 保障模型服务高可用性。例如:阿里云通过Kubernetes实现千亿参数模型的弹性扩缩容。 | 掌握容器化技术(Docker/K8s)、模型热更新、监控工具(如Prometheus)。 |
版权所有
版权归属:NateHHX