返回 职位详情 登录/注册
VLA大模型专家-M0580V
6-9万元/月
定位 上海浦东新区集贤中心
更新 2025-12-12 16:04:30 浏览 892
职位详情
大模型算法 5-10年 VLA · 具身智能 · 大模型
岗位职责:
1.VLA模型架构创新与研发:主导机器人视觉-语言-动作(VLA)大模型的结构设计、算法开发与工程实现,突破多模态特征高效对齐、动作序列生成及推理优化等核心技术瓶颈,显著增强模型在机器人操作、自动驾驶等复杂场景下的端到端任务执行性能;
2.机器人多模态智能系统构建:构建融合视觉、语言与动作信号的联合训练体系,研发基于Transformer或扩散模型的跨模态交互机制,提升模型在动态环境中的语义解析、情境认知与自主决策水平;
3.模型高效部署与优化:针对具身智能硬件平台(如机械臂、移动机器人),深度优化VLA模型的实时推理效率,综合运用算子融合、量化压缩与模型剪枝等先进技术,实现模型在边缘设备上的高性能、低时延运行;
4.跨模态数据闭环体系搭建:建立面向具身智能的大规模高质量数据采集、增强与标注流程,开发仿真验证工具链,形成数据驱动的模型迭代闭环,持续提升VLA模型在真实应用中的鲁棒性与泛化能力。

任职要求:
1、专业背景:计算机视觉、机器人学、自然语言处理等相关领域博士学历,研究方向聚焦于多模态大模型、具身智能或机器人决策控制。
2、技术能力:
(1)熟练掌握PyTorch/TensorFlow框架,具备VLA模型(如RT-2、OpenVLA、DiffusionPolicy)的优化与部署经验,了解强化学习、模仿学习等相关方法;
(2)熟悉多模态对齐技术(如CLIP、DINOv2),拥有视觉语言模型(VLM)与动作生成模块联合调优的实际经历;
(3)掌握机器人操作系统(ROS/ROS2),具备机器人感知-决策-控制全链路开发经验者优先考虑。
3、经验要求:
(1)5年以上多模态算法研发经历,主导过VLA相关项目(如自动驾驶、机械臂操作等)并推动其商业化落地;
(2)曾在NeurIPS/ICML/CoRL等顶级会议发表VLA相关研究成果,或拥有具身智能领域的核心专利。
公司信息
维沃移动通信有限公司
500-999人
明细
东莞市长安镇乌沙步步高大道288号
大渡口人才网温馨提示
求职过程请勿缴纳费用,谨防诈骗!若信息不实请举报。
相似职位
很抱歉,暂无相似职位!