Python大模型训练师(能源电力行业/国企/稳定)
面议
更新 2025-10-22 15:29:04
浏览 985
职位详情
Python
岗位要求:
1.计算机科学或相关技术领域的本科及以上学历。
2.3年以上的生产环境软件工程经验。
3.精通Python编程语言。
4.具备在至少一个主流Maas平台上管理大模型的经验。
5.具备容器化和编排技术(Docker,Kubernetes)的使用经验。
6.具备训练、微调或服务化大语言模型(LLM)的实践经验。
7.在MLOps/LLMOps领域有深厚的专业知识,包括模型的CI/CD、数据/模型版本控制和生产监控。
8.具备大规模分布式训练框架的使用经验。
9.熟悉LLM评估的学术和实践前沿。
10.在设计、构建和运营大规模分布式系统方面有可靠的过往经验。
工作内容:
1.设计、构建并维护基础LLM集群所需的可扩展、高弹性的Kubernetes基础设施。
2.开发并主导用于核心模型持续集成、验证、部署和监控的MLOps/LLMOps流水线。
3.主导使用行业基准对模型进行系统性评估,并开发新颖的框架来测试其性能、安全性、公平性和偏见。
4.将评估洞察转化为清晰、数据驱动的报告,为内部的研发和实施团队定义模型的能力边界。
5.规划并执行分布式训练和微调任务。
6.与算法科学家和应用工程师紧密合作,将下一代基础模型投入生产环境。
1.计算机科学或相关技术领域的本科及以上学历。
2.3年以上的生产环境软件工程经验。
3.精通Python编程语言。
4.具备在至少一个主流Maas平台上管理大模型的经验。
5.具备容器化和编排技术(Docker,Kubernetes)的使用经验。
6.具备训练、微调或服务化大语言模型(LLM)的实践经验。
7.在MLOps/LLMOps领域有深厚的专业知识,包括模型的CI/CD、数据/模型版本控制和生产监控。
8.具备大规模分布式训练框架的使用经验。
9.熟悉LLM评估的学术和实践前沿。
10.在设计、构建和运营大规模分布式系统方面有可靠的过往经验。
工作内容:
1.设计、构建并维护基础LLM集群所需的可扩展、高弹性的Kubernetes基础设施。
2.开发并主导用于核心模型持续集成、验证、部署和监控的MLOps/LLMOps流水线。
3.主导使用行业基准对模型进行系统性评估,并开发新颖的框架来测试其性能、安全性、公平性和偏见。
4.将评估洞察转化为清晰、数据驱动的报告,为内部的研发和实施团队定义模型的能力边界。
5.规划并执行分布式训练和微调任务。
6.与算法科学家和应用工程师紧密合作,将下一代基础模型投入生产环境。
相似职位