python开发工程师
2.2-2.6万元/月
更新 2025-12-13 11:58:03
浏览 231
职位详情
Python
3-5年
爬虫经验 · Docker · Pandas · Numpy · Python
岗位职责
1.负责大模型训练平台的架构设计、核心模块研发及性能调优,支撑大规模分布式训练任务高效运行;
2.参与数据集的构建、清洗、预处理以及高效存储方案的设计,保障数据质量与训练效率;
3.搭建模型微调(Fine-tuning)全流程工具链,涵盖参数配置、训练策略优化与资源调度实现;
4.开发模型验证与评估系统,构建自动化测试框架,确保模型表现满足业务目标;
5.优化从训练到验证再到部署的全链路流程,提升平台的稳定性和使用体验;
6.跟进大模型领域前沿技术,推动高性能计算、显存优化等关键技术的实际应用。
任职要求
1.必备技能:
-计算机相关专业专科及以上学历,具备3年以上Python开发经验;
-熟悉主流大模型训练框架(如PyTorch、DeepSpeed、Megatron-LM等),有训练平台开发背景;
-具备大模型应用场景或训练平台建设实践经验;
-熟练使用数据处理工具链(Pandas/Numpy/Dask等),拥有大规模数据集组织与管理能力;
-熟悉Linux开发环境,掌握Docker/Kubernetes等容器化技术;
-理解模型微调方法(如Lora、Adapter等),可独立完成训练流程开发与参数调优;
-了解常见模型评估指标(如BLEU、ROUGE、准确率等)及相关验证工具的开发;
2.必须项:
-具有LLM(如Qwen、ChatGLM、Baichuan等)训练或性能优化实际经验;
-熟悉LangChain、LlamaIndex等开源框架生态;
-掌握模型压缩、量化或推理加速相关技术;
-具备智能体开发的实际项目经验。
1.负责大模型训练平台的架构设计、核心模块研发及性能调优,支撑大规模分布式训练任务高效运行;
2.参与数据集的构建、清洗、预处理以及高效存储方案的设计,保障数据质量与训练效率;
3.搭建模型微调(Fine-tuning)全流程工具链,涵盖参数配置、训练策略优化与资源调度实现;
4.开发模型验证与评估系统,构建自动化测试框架,确保模型表现满足业务目标;
5.优化从训练到验证再到部署的全链路流程,提升平台的稳定性和使用体验;
6.跟进大模型领域前沿技术,推动高性能计算、显存优化等关键技术的实际应用。
任职要求
1.必备技能:
-计算机相关专业专科及以上学历,具备3年以上Python开发经验;
-熟悉主流大模型训练框架(如PyTorch、DeepSpeed、Megatron-LM等),有训练平台开发背景;
-具备大模型应用场景或训练平台建设实践经验;
-熟练使用数据处理工具链(Pandas/Numpy/Dask等),拥有大规模数据集组织与管理能力;
-熟悉Linux开发环境,掌握Docker/Kubernetes等容器化技术;
-理解模型微调方法(如Lora、Adapter等),可独立完成训练流程开发与参数调优;
-了解常见模型评估指标(如BLEU、ROUGE、准确率等)及相关验证工具的开发;
2.必须项:
-具有LLM(如Qwen、ChatGLM、Baichuan等)训练或性能优化实际经验;
-熟悉LangChain、LlamaIndex等开源框架生态;
-掌握模型压缩、量化或推理加速相关技术;
-具备智能体开发的实际项目经验。
相似职位
很抱歉,暂无相似职位!