Golang研发专家
6-9万元/月
更新 2025-12-08 14:20:10
浏览 263
职位详情
Golang
5-10年
Golang · Golang服务端开发经验 · 计算机相关专业
【团队介绍】
阿里巴巴-阿里云智能-弹性计算是阿里云飞天平台(阿里云自研云计算操作系统)的核心,在全球有数百个数据中心,为全球用户提供着可靠的计算服务。
欢迎加入弹性计算团队,来和我们一起共同管理海量物理机和虚拟机,提供超大规模服务编排能力。
【职位描述】
作为弹性计算平台核心研发工程师,您将参与或主导大规模IaaS资源全生命周期管理系统的架构设计与研发工作,负责构建支撑百万级服务器资源调度能力的智能管理平台。该职位将直面云计算基础设施领域最核心的资源管理挑战,涉及资源一致性保障、超大规模容量调度、服务质量SLA保障等关键技术方向。
主要职责包括:
1.技术架构规划与方案设计
●基于需求分析开展技术可行性评估与方案评审,结合现有技术架构完成技术选型及研发规划,明确技术目标、范围及交付成果;
●基于技术方案拆解任务目标,完成子任务的设计、编码开发及系统功能实现,确保产出符合规范;
●主导资源管理平台技术演进路线规划,制定涵盖资源建模、智能编排调度、容量管理等核心模块的技术解决方案;
●设计高可用分布式系统架构,构建支持百亿级资源元数据管理、分钟级全局资源视图同步、秒级资源事件溯源的核心引擎;
●推进云原生技术栈深度应用,主导ServiceMesh、Serverless架构在资源调度系统的落地实践。
2.核心系统研发与工程实现
●开发智能资源编排调度引擎,实现基础设施全生命周期的资源调度与编排功能;
●构建资源基线及画像系统,基于最优化算法平衡资源转化效率与组件服务质量管理;
●主导关键模块的代码评审与技术方案论证,编写技术文档(操作手册、故障排除指南、API文档等),支撑日常运维与问题答疑;
●负责核心功能架构与代码模板编写,并通过阶段性CodeReview、调试优化及部署协作,推动代码高质量交付;
●负责开发及部署后系统的维护迭代,包括值班oncall、Bug排查、问题诊断、产品体验优化、性能及成本调优。
3.安全、稳定与性能优化
●运用产品优化技术提升系统安全性与性能,增强平台稳定性与用户体验。
4.技术预研与趋势洞察
●跟踪国内外资源管理平台技术发展动态,结合业务需求提供技术支持及架构建议。
5.技术规划与业务协同
●深度理解业务重点,基于需求设计高可用、高可靠、高扩展性的技术架构,并推动方案落地。
【我们期待您具备】
•计算机基础扎实,具备Golang实际项目开发经验,熟练掌握Golang运行原理;
•5年以上IT、互联网、云计算开发、运维相关工作经验;
•熟悉Linux操作系统并具备常见问题诊断能力,了解内存管理、调度、文件系统、网络等相关机制;
•对常用算法理解透彻,能够独立分析拆解业务问题转化为有效的工程方案;
•具备良好的代码质量意识,熟悉单元测试和自动化接口测试;
•对自己负责的研发模块具备快速上线、响应、应急处理能力;
•能够独立的进行模块、子系统或子领域的复杂度治理工作和跨1-2个技术栈的方案设计工作;
•善于沟通,乐于总结分享,有良好的团队协作能力,对解决具有挑战性的问题充满激情。
加分项:
•熟悉云计算业务,具备大型系统架构经验,有云资源管理平台开发经验和阿里云OpenAPI使用经验;
•熟悉容器、K8s相关生态,具备大规模K8s生产集群管理实践经验;
•熟悉AI大模型,善于使用AI工具,并在生产系统中有过实践经验;
•在SIGCOMM、NSDI、OSDI等顶级会议上发表论文或具有专利成果者优先。
阿里巴巴-阿里云智能-弹性计算是阿里云飞天平台(阿里云自研云计算操作系统)的核心,在全球有数百个数据中心,为全球用户提供着可靠的计算服务。
欢迎加入弹性计算团队,来和我们一起共同管理海量物理机和虚拟机,提供超大规模服务编排能力。
【职位描述】
作为弹性计算平台核心研发工程师,您将参与或主导大规模IaaS资源全生命周期管理系统的架构设计与研发工作,负责构建支撑百万级服务器资源调度能力的智能管理平台。该职位将直面云计算基础设施领域最核心的资源管理挑战,涉及资源一致性保障、超大规模容量调度、服务质量SLA保障等关键技术方向。
主要职责包括:
1.技术架构规划与方案设计
●基于需求分析开展技术可行性评估与方案评审,结合现有技术架构完成技术选型及研发规划,明确技术目标、范围及交付成果;
●基于技术方案拆解任务目标,完成子任务的设计、编码开发及系统功能实现,确保产出符合规范;
●主导资源管理平台技术演进路线规划,制定涵盖资源建模、智能编排调度、容量管理等核心模块的技术解决方案;
●设计高可用分布式系统架构,构建支持百亿级资源元数据管理、分钟级全局资源视图同步、秒级资源事件溯源的核心引擎;
●推进云原生技术栈深度应用,主导ServiceMesh、Serverless架构在资源调度系统的落地实践。
2.核心系统研发与工程实现
●开发智能资源编排调度引擎,实现基础设施全生命周期的资源调度与编排功能;
●构建资源基线及画像系统,基于最优化算法平衡资源转化效率与组件服务质量管理;
●主导关键模块的代码评审与技术方案论证,编写技术文档(操作手册、故障排除指南、API文档等),支撑日常运维与问题答疑;
●负责核心功能架构与代码模板编写,并通过阶段性CodeReview、调试优化及部署协作,推动代码高质量交付;
●负责开发及部署后系统的维护迭代,包括值班oncall、Bug排查、问题诊断、产品体验优化、性能及成本调优。
3.安全、稳定与性能优化
●运用产品优化技术提升系统安全性与性能,增强平台稳定性与用户体验。
4.技术预研与趋势洞察
●跟踪国内外资源管理平台技术发展动态,结合业务需求提供技术支持及架构建议。
5.技术规划与业务协同
●深度理解业务重点,基于需求设计高可用、高可靠、高扩展性的技术架构,并推动方案落地。
【我们期待您具备】
•计算机基础扎实,具备Golang实际项目开发经验,熟练掌握Golang运行原理;
•5年以上IT、互联网、云计算开发、运维相关工作经验;
•熟悉Linux操作系统并具备常见问题诊断能力,了解内存管理、调度、文件系统、网络等相关机制;
•对常用算法理解透彻,能够独立分析拆解业务问题转化为有效的工程方案;
•具备良好的代码质量意识,熟悉单元测试和自动化接口测试;
•对自己负责的研发模块具备快速上线、响应、应急处理能力;
•能够独立的进行模块、子系统或子领域的复杂度治理工作和跨1-2个技术栈的方案设计工作;
•善于沟通,乐于总结分享,有良好的团队协作能力,对解决具有挑战性的问题充满激情。
加分项:
•熟悉云计算业务,具备大型系统架构经验,有云资源管理平台开发经验和阿里云OpenAPI使用经验;
•熟悉容器、K8s相关生态,具备大规模K8s生产集群管理实践经验;
•熟悉AI大模型,善于使用AI工具,并在生产系统中有过实践经验;
•在SIGCOMM、NSDI、OSDI等顶级会议上发表论文或具有专利成果者优先。
相似职位
很抱歉,暂无相似职位!