職位描述
該職位信息待核驗,請仔細了解后再進行投遞!
崗位職責:
1.負責SRE運維體系建設,設計相關制度、規范與機制,開發、配置和維護相關工具及系統,實現高水平的系統可靠性與可用性;
2.負責領導事件響應工作,包括故障排除、溝通和事件后分析,以最小化對可用性和性能的影響;
3.負責自動化常規任務和流程,提高系統效率并降低人為錯誤的可能性;
4.負責建設SLO/SLI指標體系,設計基于錯誤預算的穩定性評估模型;
5.參與重大架構方案的設計與評審及業務系統容量規劃;
6.參與 OnCall 值班,與研發工程師共同解決各類突發事件,保障核心業務持續穩定性運行;
7.接應集團運維相關要求,解讀、落實相關規范要求,組織相關配合行動開展;
8.完成領導安排的其他工作任務。
任職要求:
1.大學本科及以上學歷,計算機或者相關專業;
2.熟悉Shell、Python、Go等編程語言,具備Linux開發經驗;
3.5年以上SRE或DevOps經驗,有大型互聯網公司運維經驗者優先;
4.精通Docker、K8S架構和技術原理,具備大規模生產環境運維、排錯和優化經驗;
5.熟悉各個大廠(天翼云、華為云、阿里云)中至少一種公有云的運維管理;
6.熟練使用Ansible/Grafana/Prometheus等自動化運維工具鏈;
7.具有豐富的應急處置、應用穩定性建設經驗,對高可用架構有較深入理解;
8.具有良好的洞察力、思路清晰和歸納總結能力,有較強的文檔編寫能力,能承受較大工作壓力;
9.具有一定的協調、組織和溝通能力,踏實的工作心態、積極主動的工作態度,高度的責任心。
1.負責SRE運維體系建設,設計相關制度、規范與機制,開發、配置和維護相關工具及系統,實現高水平的系統可靠性與可用性;
2.負責領導事件響應工作,包括故障排除、溝通和事件后分析,以最小化對可用性和性能的影響;
3.負責自動化常規任務和流程,提高系統效率并降低人為錯誤的可能性;
4.負責建設SLO/SLI指標體系,設計基于錯誤預算的穩定性評估模型;
5.參與重大架構方案的設計與評審及業務系統容量規劃;
6.參與 OnCall 值班,與研發工程師共同解決各類突發事件,保障核心業務持續穩定性運行;
7.接應集團運維相關要求,解讀、落實相關規范要求,組織相關配合行動開展;
8.完成領導安排的其他工作任務。
任職要求:
1.大學本科及以上學歷,計算機或者相關專業;
2.熟悉Shell、Python、Go等編程語言,具備Linux開發經驗;
3.5年以上SRE或DevOps經驗,有大型互聯網公司運維經驗者優先;
4.精通Docker、K8S架構和技術原理,具備大規模生產環境運維、排錯和優化經驗;
5.熟悉各個大廠(天翼云、華為云、阿里云)中至少一種公有云的運維管理;
6.熟練使用Ansible/Grafana/Prometheus等自動化運維工具鏈;
7.具有豐富的應急處置、應用穩定性建設經驗,對高可用架構有較深入理解;
8.具有良好的洞察力、思路清晰和歸納總結能力,有較強的文檔編寫能力,能承受較大工作壓力;
9.具有一定的協調、組織和溝通能力,踏實的工作心態、積極主動的工作態度,高度的責任心。
工作地點
地址:北京石景山區北京石景山區點石商務公園
??
點擊查看地圖
詳細位置,可以參考上方地址信息
求職提示:用人單位發布虛假招聘信息,或以任何名義向求職者收取財物(如體檢費、置裝費、押金、服裝費、培訓費、身份證、畢業證等),均涉嫌違法,請求職者務必提高警惕。
職位發布者
蘇巍HR
江蘇基久網絡科技有限公司北京分公司
-
通信/電信/網絡設備/增值服務
-
1000人以上
-
國有企業
-
華天大廈1516

應屆畢業生
學歷不限
2026-04-23 23:34:49
616人關注
注:聯系我時,請說是在河北人才網上看到的。
