强化学习算法研究员（深圳）招聘_腾讯科技(深圳)有限公司-大渡口人才网

强化学习算法研究员（深圳）

4-7万元/月

深圳南山区腾讯数码大厦南塔

更新 2025-12-16 18:37:33 浏览 911

职位详情

算法研究员 5-10年

岗位职责：
1.作为研究者，探索高效的AgenticWorkflow与AgenticMemory架构，以应对代码领域的实际挑战；
2.聚焦于优于SFT泛化能力的强化学习方法；能结合用户实际需求、用户行为数据及agent实现细节，优化训练语料与目标设计；
3.与agent开发团队紧密协作，设计memory读写机制，并通过模型训练使模型更好适配所设计的agent架构；
4.作为工程师，针对LLM推理对算力的高需求，设计合理的前后端交互流程、前端结构与后端系统架构，在有限算力条件下实现完整的AgenticWorkflow方案；优先探索具备通用性与可扩展性的解决方案。

任职要求：
1.自然语言处理/机器学习/模式识别/人工智能/计算机等相关专业硕士及以上学历；
2.具备5年以上工程开发经验，熟练掌握Python，C/C++，Golang，Java，JavaScript，TypeScript中至少一种编程语言；
3.掌握深度学习基础理论，能根据具体任务进行定制化优化，熟悉各类深度学习任务及其主流模型与算法；
4.在PromptEngineering、AgenticWorkflow、GRPO等基于GPT架构的NLP强化学习技术方面有实际项目经验；
5.有在ACL、EMNLP、NeurIPS、ICML、ICLR等高水平会议发表论文者优先考虑。

加分项：
1.同等条件下，持有腾讯云认证或同类资质认证的候选人将被优先录用。

公司信息

腾讯科技(深圳)有限公司

深圳市南山区高新区科技中一路腾讯大厦35层

大渡口人才网温馨提示

求职过程请勿缴纳费用，谨防诈骗！若信息不实请举报。

相似职位

很抱歉,暂无相似职位！