返回 职位详情 登录/注册
机器人VLA大模型专家-U6917D
6-9万元/月
定位 东莞长安工业园B区
更新 2025-12-12 16:04:33 浏览 155
职位详情
GIS工程师 5-10年 VLA · 具身智能 · 大模型
岗位职责:
1.VLA模型架构创新与研发:主导机器人视觉-语言-动作(VLA)大模型的结构设计、算法开发与工程实现,突破多模态特征高效对齐、动作序列生成及推理优化等核心技术瓶颈,显著增强模型在机器人操作、自动驾驶等复杂场景下的端到端任务执行性能;
2.机器人多模态智能系统构建:设计并落地融合视觉、语言与动作信号的联合训练体系,研发基于Transformer或扩散模型的跨模态交互机制,提升模型在动态环境中的语义感知、情境理解与自主决策水平;
3.模型高效部署与优化:针对具身智能硬件平台(如机械臂、移动机器人),深度优化VLA模型的实时推理效率,采用算子融合、量化压缩、模型剪枝等先进技术,实现模型在边缘设备上的高性能、低时延运行;
4.跨模态数据闭环体系搭建:搭建面向具身智能的大规模高质量数据采集、增强与标注流程,开发仿真验证工具链,构建数据驱动的模型迭代闭环,持续提升VLA模型在真实应用中的鲁棒性与泛化能力。

任职要求:
1、专业背景:计算机视觉、机器人学、自然语言处理等相关领域博士学历,研究方向集中于多模态大模型、具身智能或机器人决策控制。
2、技术能力:
(1)熟练掌握PyTorch/TensorFlow框架,具备VLA模型(如RT-2、OpenVLA、DiffusionPolicy)改进与部署经验,了解强化学习、模仿学习等相关方法;
(2)熟悉多模态对齐技术(CLIP、DINOv2等),拥有视觉语言模型(VLM)与动作生成模块联合调优实践;
(3)掌握机器人操作系统(ROS/ROS2),具备机器人感知-决策-控制全栈开发经验者优先。
3、经验要求:
(1)5年以上多模态算法研发经历,主导过VLA相关项目(如自动驾驶、机械臂操作等)并推动其商业化落地;
(2)在NeurIPS/ICML/CoRL等顶级会议发表过多篇VLA相关论文,或拥有具身智能领域的核心专利。
公司信息
维沃移动通信有限公司
500-999人
明细
东莞市长安镇乌沙步步高大道288号
大渡口人才网温馨提示
求职过程请勿缴纳费用,谨防诈骗!若信息不实请举报。
相似职位
很抱歉,暂无相似职位!