返回 职位详情 登录/注册
基础研发稳定性治理质量专家
2.5-3.5万元/月
定位 北京海淀区维亚大厦
更新 2025-10-14 02:59:40 浏览 688
职位详情
Java 3-5年
团队职责:
1.负责核心中间件(如APM、自动化测试、压测、故障演练系统等)的稳定运行与性能优化,保障全链路服务的高可用性。
2.主导监控报警体系、部署工具、智能体平台等系统的搭建与持续迭代,提升问题发现与故障响应效率。
3.制定并推动实施整体稳定性建设规范,涵盖容量规划、容灾架构设计、应急预案演练等,系统性降低线上风险。
4.运用压力测试、故障注入、自动化巡检等方式,识别系统隐患并推进问题闭环解决。
5.建立故障预警与事后复盘机制,促进稳定性文化的建设和工具链的不断完善。

候选人能力要求

技术能力:
1.5年以上互联网或云计算行业经验,掌握分布式系统架构,熟练掌握至少一种编程语言(如Java/Python/Go)。
2.具备完整的全链路稳定性建设经验,熟悉监控告警机制、SLA标准制定及故障应急流程,了解混沌工程与容灾演练实践。
3.深入理解常用中间件(如APM、压测平台)和运维工具(如自动发布、日志分析系统)的技术实现原理。
4.掌握系统性能调优方法,能够通过压测和链路追踪定位瓶颈,并提出有效优化策略。

软性能力:
1.具备跨部门协作和整体架构规划能力,可牵头复杂项目的执行与落地。
2.对技术风险有敏锐洞察力,能提前识别潜在问题并制定应对方案。
3.沟通表达能力强,可协调开发、运维与业务多方共同达成稳定性目标。
4.承压能力强,能胜任7×24小时故障响应的工作要求。

加分项:
-具备大型互联网企业稳定性团队管理背景。
-了解智能运维(AIOps)、故障自愈等先进技术方向。
公司信息
北京趣拿软件科技有限公司
明细
北京市海淀区苏州街29号院18号楼馆豆大厦17楼1701-1707,1710-1720室
大渡口人才网温馨提示
求职过程请勿缴纳费用,谨防诈骗!若信息不实请举报。
相似职位
重庆大渡口区
售后维修
5000-8000/元
重庆大渡口区
库管
3000-4000/元
重庆大渡口区
重庆大渡口区
重庆大渡口区