返回 职位详情 登录/注册
异构计算软硬件协同高级研发工程师
5-8万元/月
定位 杭州西湖区阿里巴巴云谷园区一号楼
更新 2025-12-11 14:31:57 浏览 304
职位详情
C/C++ 3-5年 编译器开发经验 · C++ · 分布式经验 · C · PostgreSQL · Redis · 架构设计经验 · Linux开发/部署经验 · Python
职位描述
1.深入理解主流AI芯片与服务器架构,分析硬件加速特性及内部拓扑结构,输出硬件优化实践方案与调优指导,充分释放硬件性能潜力。
2.基于主流LLM推理框架(如sglang/vLLM)以及大模型结构和计算特征,通过软硬件协同设计与技术突破(涵盖硬件算子优化、显存管理、并行策略等),完成新服务器平台端到端性能评估与深度优化。
3.提供面向具体场景的定制化优化能力,精准识别大模型在多样化业务环境中的性能瓶颈,快速制定并落地满足实际需求的性能提升方案。
4.熟练运用系统级调优与Profiling工具(如nsys/ncu系列、Perf、火焰图等),开展系统性能剖析与瓶颈定位,并结合硬件特性实施软件适配与性能增强。
5.把握大模型技术发展方向,结合硬件Profiling与Trace数据分析,为下一代AI基础设施的服务器架构设计与研发提供量化决策支持。

职位要求
1.掌握主流AI加速芯片(如NVIDIA、AMD、寒武纪/DCU等)的体系结构、指令集与计算特点,具备异构计算环境下开发与性能调优实战经验。
2.熟悉sglang/vLLM/Pytorch等主流LLM推理框架,具备二次开发或深度优化经验(包括KVCache优化、编译优化、Speculative执行、量化、DeepEP等技术)。
3.具备优秀的沟通协作与项目推动能力,能够与跨职能团队高效协同,对项目进度与交付质量进行有效规划与管控,保障项目顺利落地。

如下经验优先:
1.具备sglang/vLLM在新硬件平台上的适配与优化经验,有针对Qwen/DeepSeek类大模型进行性能调优者优先
公司信息
阿里云计算有限公司
明细
浙江省杭州市西湖区三墩镇灯彩街1008号云谷园区1-2-A06室
大渡口人才网温馨提示
求职过程请勿缴纳费用,谨防诈骗!若信息不实请举报。
相似职位
很抱歉,暂无相似职位!