1.监控云平台运行状态,确保系统的高可用性和稳定性; 2.编写和维护运维文档,包括操作手册、故障排查指南和应急预案; 3.分析并排除系统、数据库、网络及应用等故障。
1.计算机通信或相关专业本科以上学历,3年以上DevOps/CI、CD/容器化/运维/开发工作经验,3年以上传统/互联网业务运维经验; 2.精通AWS云平台运维,熟悉AWS各种类云产品使用、故障排查 3.了解SRE运维流程及操作能力,具备大型系统自动化运维能力 4.熟悉监控预警平台、调度服务的搭建/运维:ELK、Grafana等; 5.熟练掌握Java、shell、Python其中一种脚本语言,熟悉Java、python运行环境; 6.具备扎实的Linux平台运维和调试能力,能够熟练进行故障排查、配置调优、性能分析; 6.高度的责任心,能够吃苦耐劳、有强烈的服务意识、良好的沟通能力与执行能力,善于团队合作。
面议