强化学习算法研究员(深圳)
4-7万元/月
更新 2025-12-16 18:37:33
浏览 911
职位详情
算法研究员
5-10年
岗位职责:
1.作为研究者,探索高效的AgenticWorkflow与AgenticMemory架构,以应对代码领域的实际挑战;
2.聚焦于优于SFT泛化能力的强化学习方法;能结合用户实际需求、用户行为数据及agent实现细节,优化训练语料与目标设计;
3.与agent开发团队紧密协作,设计memory读写机制,并通过模型训练使模型更好适配所设计的agent架构;
4.作为工程师,针对LLM推理对算力的高需求,设计合理的前后端交互流程、前端结构与后端系统架构,在有限算力条件下实现完整的AgenticWorkflow方案;优先探索具备通用性与可扩展性的解决方案。
任职要求:
1.自然语言处理/机器学习/模式识别/人工智能/计算机等相关专业硕士及以上学历;
2.具备5年以上工程开发经验,熟练掌握Python,C/C++,Golang,Java,JavaScript,TypeScript中至少一种编程语言;
3.掌握深度学习基础理论,能根据具体任务进行定制化优化,熟悉各类深度学习任务及其主流模型与算法;
4.在PromptEngineering、AgenticWorkflow、GRPO等基于GPT架构的NLP强化学习技术方面有实际项目经验;
5.有在ACL、EMNLP、NeurIPS、ICML、ICLR等高水平会议发表论文者优先考虑。
加分项:
1.同等条件下,持有腾讯云认证或同类资质认证的候选人将被优先录用。
1.作为研究者,探索高效的AgenticWorkflow与AgenticMemory架构,以应对代码领域的实际挑战;
2.聚焦于优于SFT泛化能力的强化学习方法;能结合用户实际需求、用户行为数据及agent实现细节,优化训练语料与目标设计;
3.与agent开发团队紧密协作,设计memory读写机制,并通过模型训练使模型更好适配所设计的agent架构;
4.作为工程师,针对LLM推理对算力的高需求,设计合理的前后端交互流程、前端结构与后端系统架构,在有限算力条件下实现完整的AgenticWorkflow方案;优先探索具备通用性与可扩展性的解决方案。
任职要求:
1.自然语言处理/机器学习/模式识别/人工智能/计算机等相关专业硕士及以上学历;
2.具备5年以上工程开发经验,熟练掌握Python,C/C++,Golang,Java,JavaScript,TypeScript中至少一种编程语言;
3.掌握深度学习基础理论,能根据具体任务进行定制化优化,熟悉各类深度学习任务及其主流模型与算法;
4.在PromptEngineering、AgenticWorkflow、GRPO等基于GPT架构的NLP强化学习技术方面有实际项目经验;
5.有在ACL、EMNLP、NeurIPS、ICML、ICLR等高水平会议发表论文者优先考虑。
加分项:
1.同等条件下,持有腾讯云认证或同类资质认证的候选人将被优先录用。
相似职位
很抱歉,暂无相似职位!