返回 职位详情 登录/注册
异构计算软硬件结合高级开发-深圳/杭州
5-8万元/月
定位 杭州西湖区阿里巴巴云谷园区1号楼
更新 2025-12-12 16:37:35 浏览 702
职位详情
C/C++ 3-5年 高性能推理 · C++ · 算子优化 · AI芯片
职位描述
1.基于对主流AI芯片和服务器架构的深刻理解,分析硬件加速特征与内部拓扑结构,提供硬件优化实践和调优指南,确保充分发挥硬件潜能。
2.结合主流LLM推理框架(如sglang/vLLM)和大模型结构及其计算特性,通过软硬件协同优化和技术创新(包括但不限于硬件算子优化、显存以及并行化等),负责新服务器上的端到端性能分析和优化。
3.提供场景化的定制优化能力,识别并解决大模型在不同业务场景下的性能瓶颈,快速的给出满足需求的性能优化方案。
4.熟悉系统调优和Profiling工具(如nsys/ncu系列、通用工具如Perf、火焰图等),负责系统级性能分析与瓶颈定位能力,并能基于硬件特性进行软件适配与优化。
5.洞悉大模型的发展趋势和技术演进,结合硬件Profling和Trace数据,为下一代AI基础设施的服务器设计与研发提供量化数据分析支持。
职位要求
1.具备扎实的工程能力,精通C++和Python等编程语言,熟悉Cuda/Cutlass/Trition的编程经验,有高性能推理代码和优化经验。
2.熟悉主流AI加速芯片(如NVIDIA、AMD、寒武纪/DCU等)的系统结构、指令集和计算特性,具备异构计算硬件下的开发和性能优化经验。
3.熟悉sglang/vLLM/Pytorch等主流LLM推理框架、二次开发或深度优化经验(如KVCache、编译优化,Speculative、量化,DeepEP等优化技术)。
4.熟悉服务器硬件架构(CPU、内存、网络、存储等)及多异构芯片拓扑结构,具备系统级性能分析与瓶颈定位能力,并能基于硬件特性进行软件适配与优化。
5.具备良好的沟通协作能力和项目组织能力,能与不同背景的团队高效沟通、协同,并对项目进行有效的组织与规划,以确保项目按时按质按量完成。

如下经验优先:
1.性能调优经验:sglang/vLLM新硬件使能和优化经验,针对Qwen/DeepSeek模型优化的经验优先
2.算子优化经验:针对大模型,具备cutlass,Trition的算子优化,投机采样,TP/EP并行优化经验优
公司信息
阿里云计算有限公司
明细
浙江省杭州市西湖区三墩镇灯彩街1008号云谷园区1-2-A06室
大渡口人才网温馨提示
求职过程请勿缴纳费用,谨防诈骗!若信息不实请举报。
相似职位
很抱歉,暂无相似职位!