返回 职位详情 登录/注册
通义实验室-模型推理服务技术专家-北/杭
2.5-5万元/月
定位 北京朝阳区阿里巴巴·朝阳科技园1
更新 2025-12-09 06:56:35 浏览 673
职位详情
Java 1-3年 Java · C++ · Python
通义实验室工程团队专注于构建面向公众与企业的大规模、高性能在线AI服务平台,全面支撑通义千问、通义万相及多种开源先进模型的线上服务,持续推进AIAgents、多模态应用、MCP等前沿技术的工程化落地。团队在异构GPU资源调度、多模型多地域部署、多模态任务统一推理、多样化服务等级保障(SLO)以及模型推理全链路工程化等核心技术难题上不断突破,持续提升系统性能、资源效率与平台稳定性。

职位描述
1、设计并实现高性能AI原生网关。打造低延迟、高并发的API网关架构,支持多模态数据与多种通信协议接入,为国内及海外用户提供安全、灵活、可扩展的流量接入能力,提供完整的数据面管控与可观测性支持;

2、研发智能推理调度与资源管理机制。面向复杂分布式推理场景,构建高效的请求与资源协同调度系统,结合动态负载特征与异构计算资源,优化请求分发策略;推进Serverless化资源调度体系建设,实现资源弹性伸缩与利用率最大化;

3、建设领先的MLOps平台功能。深度优化模型服务的CI/CD流程,推动算法从研发到上线的自动化与标准化;实现模型版本控制、灰度发布、监控告警、性能分析等全生命周期管理能力,提升迭代速度与系统可靠性。

职位要求
1、计算机或人工智能相关专业硕士及以上学历,精通C++/Python/Java中至少一门编程语言,具备良好的系统抽象能力;

2、深入理解Linux/Posix操作系统原理,掌握多线程、异步编程设计方法,熟悉高效开发与调试实践;

3、熟悉微服务架构与分布式系统设计,具备网关系统、调度系统、k8s或云原生平台开发经验者优先考虑;

4、具有出色的抽象思维、工程判断力和跨团队协作能力,致力于打造高性能、高可用的系统架构。

加分项
1、了解主流开源推理引擎的架构设计与实现原理,长期关注推理引擎相关开源项目发展;

2、在高性能计算领域有论文发表或相关实践经验
公司信息
阿里云计算有限公司
明细
浙江省杭州市西湖区三墩镇灯彩街1008号云谷园区1-2-A06室
大渡口人才网温馨提示
求职过程请勿缴纳费用,谨防诈骗!若信息不实请举报。
相似职位
很抱歉,暂无相似职位!