基座大模型算法专家
7-9万元/月
更新 2025-12-12 16:04:28
浏览 391
职位详情
大模型算法
5-10年
一、工作职责
1.负责终端侧基础大模型的算法研究与核心技术突破,应用方向涵盖面向手机场景的文本及多模态内容生成与理解任务(如智能语音助手、UI-Agent等)。
2.跟踪文本、多模态预训练、强化学习、推理优化等相关领域的前沿技术进展,结合公司核心业务需求,研发具有创新性的先进算法,打造具备行业领先水平的端侧基础模型。
3.参与顶级会议论文撰写与发表,开展外部技术交流,提升团队在业界的技术影响力。
二、任职要求
1.以第一作者身份在AI领域顶级会议上发表过大模型相关论文至少1篇。
2.具备大规模模型(参数量1B以上、训练token达1T以上、文本或多模态)的预训练或后训练(SFT、PPO、GRPO、RLVR等)实际项目经验。
3.熟练掌握以下至少一种编程语言:python,Java,C/C++,并熟悉主流开发框架(如:Megatron、pytorch、verl),拥有大模型相关代码实现与调参经历。
4.有参与知名商用大模型算法研发项目的优先考虑。
5.在权威评测榜单(如opencompass、superGLUE)中取得前五名成绩者优先。
1.负责终端侧基础大模型的算法研究与核心技术突破,应用方向涵盖面向手机场景的文本及多模态内容生成与理解任务(如智能语音助手、UI-Agent等)。
2.跟踪文本、多模态预训练、强化学习、推理优化等相关领域的前沿技术进展,结合公司核心业务需求,研发具有创新性的先进算法,打造具备行业领先水平的端侧基础模型。
3.参与顶级会议论文撰写与发表,开展外部技术交流,提升团队在业界的技术影响力。
二、任职要求
1.以第一作者身份在AI领域顶级会议上发表过大模型相关论文至少1篇。
2.具备大规模模型(参数量1B以上、训练token达1T以上、文本或多模态)的预训练或后训练(SFT、PPO、GRPO、RLVR等)实际项目经验。
3.熟练掌握以下至少一种编程语言:python,Java,C/C++,并熟悉主流开发框架(如:Megatron、pytorch、verl),拥有大模型相关代码实现与调参经历。
4.有参与知名商用大模型算法研发项目的优先考虑。
5.在权威评测榜单(如opencompass、superGLUE)中取得前五名成绩者优先。
相似职位
很抱歉,暂无相似职位!