异构计算高级开发工程师
3-6万元/月
更新 2025-12-09 07:02:47
浏览 403
职位详情
C/C++
5-10年
vLLM · C++ · C · 大模型 · CPU/GPU
1.参与AI基础软件平台的研发与性能调优,满足阿里云客户在AI基础设施方面的实际应用需求;
2.持续关注行业前沿技术进展,推动新技术的落地实施,包括新型硬件架构、异构计算体系及大规模AI模型系统的工程化实践;
3.面向AI计算场景,设计并实现适用于CPU/GPU等混合环境下的显存调度与算力优化方案;
4.结合操作系统层面的协同机制,对AI框架进行深度优化,提升模型推理效率,降低大模型服务部署成本;
5.联动产品团队,推进核心技术成果的产品化落地与规模化应用。
职位描述
*8年以上相关技术领域工作经验,具备扎实的计算机系统理论基础,熟练掌握C/C++/Rust/Python等编程语言;
*在以下一个或多个方向具有实践经验:
1.精通C/C++开发,熟悉CUDA编程、多线程并发处理机制,对异构计算平台有深入理解并具备实际项目经验;
2.有主流AI框架(如PyTorch/vLLM)开发经历,了解框架底层运行机制与性能优化方法,参与过vLLM社区开发者优先;
3.掌握大模型系统架构与优化技术,例如Prefill/Decoding流程设计、SpeculativeDecoding等关键技术;
*具备大规模模型训练、推理部署及性能调优经验者优先考虑;
*具有较强的系统问题分析与解决能力,能在复杂环境中定位性能瓶颈并实施有效优化;
*热衷技术创新,富有探索精神,具备良好的沟通协作能力与团队意识。
2.持续关注行业前沿技术进展,推动新技术的落地实施,包括新型硬件架构、异构计算体系及大规模AI模型系统的工程化实践;
3.面向AI计算场景,设计并实现适用于CPU/GPU等混合环境下的显存调度与算力优化方案;
4.结合操作系统层面的协同机制,对AI框架进行深度优化,提升模型推理效率,降低大模型服务部署成本;
5.联动产品团队,推进核心技术成果的产品化落地与规模化应用。
职位描述
*8年以上相关技术领域工作经验,具备扎实的计算机系统理论基础,熟练掌握C/C++/Rust/Python等编程语言;
*在以下一个或多个方向具有实践经验:
1.精通C/C++开发,熟悉CUDA编程、多线程并发处理机制,对异构计算平台有深入理解并具备实际项目经验;
2.有主流AI框架(如PyTorch/vLLM)开发经历,了解框架底层运行机制与性能优化方法,参与过vLLM社区开发者优先;
3.掌握大模型系统架构与优化技术,例如Prefill/Decoding流程设计、SpeculativeDecoding等关键技术;
*具备大规模模型训练、推理部署及性能调优经验者优先考虑;
*具有较强的系统问题分析与解决能力,能在复杂环境中定位性能瓶颈并实施有效优化;
*热衷技术创新,富有探索精神,具备良好的沟通协作能力与团队意识。
相似职位
很抱歉,暂无相似职位!