算法研发工程师
1.3-1.8万元/月

更新 2025-10-14 10:39:10
浏览 155
职位详情
算法工程师
3-5年
【岗位职责】:
1、模型微调与优化:参与大模型在协同办公与建筑行业场景中的实际应用,包括基于公有云大模型实现私有资料的对接与局部微调,或基于私有化大模型开展垂直领域内的数据采集、自动标注及微调训练工作;
2、应用落地:承担大模型的适配与实际应用任务,涵盖LLM、Langchain、Agent、Eval等相关技术的集成与实施;
3、性能评估监测与部署:定期对模型运行表现进行监控,完成特定应用场景下各项模型能力的评测工作,确保满足业务需求,并实现模型的容器化部署。
【技能要求】:
1、具备大模型相关项目的开发经验,涉及数据清洗、开源模型的实际微调、训练框架构建、效果评测及推理部署等环节;
2、熟练掌握Python编程语言,了解Java等其他语言,熟悉PyTorch、TensorFlow等主流深度学习框架;
3、掌握大语言模型的增量预训练、指令微调、偏好对齐等训练方式,具备全流程训练落地实践经验;
4、熟悉全参数微调、LoRA、QLoRA等常见微调技术,具有实际场景中的微调落地经历;
5、了解DeepSpeed、flash-attn、vllm等用于大模型训练与推理加速的技术方案;
6、熟悉数据获取、清洗和预处理流程,具备训练数据构造的实际项目经验;
7、掌握Docker、Kubernetes等容器及编排技术;
8、具备良好的数学基础,熟悉概率统计、线性代数、优化算法等相关知识;
9、有成功改进训练算法、提升模型表现的项目案例,可独立完成算法设计与开发工作,具备独立推进任务的能力;
10、对深度学习领域的技术发展保持敏感,积极学习并探索前沿技术方法。
1、模型微调与优化:参与大模型在协同办公与建筑行业场景中的实际应用,包括基于公有云大模型实现私有资料的对接与局部微调,或基于私有化大模型开展垂直领域内的数据采集、自动标注及微调训练工作;
2、应用落地:承担大模型的适配与实际应用任务,涵盖LLM、Langchain、Agent、Eval等相关技术的集成与实施;
3、性能评估监测与部署:定期对模型运行表现进行监控,完成特定应用场景下各项模型能力的评测工作,确保满足业务需求,并实现模型的容器化部署。
【技能要求】:
1、具备大模型相关项目的开发经验,涉及数据清洗、开源模型的实际微调、训练框架构建、效果评测及推理部署等环节;
2、熟练掌握Python编程语言,了解Java等其他语言,熟悉PyTorch、TensorFlow等主流深度学习框架;
3、掌握大语言模型的增量预训练、指令微调、偏好对齐等训练方式,具备全流程训练落地实践经验;
4、熟悉全参数微调、LoRA、QLoRA等常见微调技术,具有实际场景中的微调落地经历;
5、了解DeepSpeed、flash-attn、vllm等用于大模型训练与推理加速的技术方案;
6、熟悉数据获取、清洗和预处理流程,具备训练数据构造的实际项目经验;
7、掌握Docker、Kubernetes等容器及编排技术;
8、具备良好的数学基础,熟悉概率统计、线性代数、优化算法等相关知识;
9、有成功改进训练算法、提升模型表现的项目案例,可独立完成算法设计与开发工作,具备独立推进任务的能力;
10、对深度学习领域的技术发展保持敏感,积极学习并探索前沿技术方法。
相似职位