崗位職責
1.負責云平臺運營運維體系的整體規劃、建設與持續優化,建立涵蓋云資源申請、審批、分配、使用監控到回收的全生命周期閉環管理流程,提升資源利用率與管理規范性。
2. 設計并開發自動化運維工具與平臺功能模塊,實現部署、配置、巡檢、故障處理等場景的自動化,提升系統交付效率與穩定性,降低運維人力成本。
3.構建覆蓋基礎設施、中間件、應用服務的全方位監控與智能告警體系,集成指標采集、日志分析、鏈路追蹤等能力,及時發現并響應潛在風險,保障云平臺高可用與業務連續性。
4. 深入調研內部用戶需求與典型使用場景,收集反饋并推動產品功能優化,持續提升平臺易用性、用戶體驗與用戶滿意度。
5. 與研發、安全、網絡、業務等部門高效協同,參與云平臺產品的需求評審、方案設計與迭代優化,推動技術方案落地與規模化應用。
任職要求:
1.本科及以上學歷,計算機、軟件工程、網絡工程或相關專業,3年以上云計算、運維開發或平臺運營相關工作經驗。
2.熟悉主流公有云/私有云平臺(如阿里云、AWS、OpenStack、Kubernetes等)架構與核心服務,具備云資源管理與運營實踐經驗。
3.熟練掌握至少一種腳本語言(Python/Shell/Go等),具備自動化工具開發能力,熟悉CI/CD、IaC(如Terraform、Ansible)者優先。
4. 熟悉 Prometheus、Grafana、ELK、Zabbix 等監控與日志分析工具,具備構建大型系統監控告警體系的經驗。
5. 具備良好的邏輯思維與問題分析能力,對流程優化與用戶體驗有敏銳洞察力。
6. 具備出色的溝通協調能力與跨團隊協作意識,能夠在復雜環境中推動項目落地。
7. 有ITSM工單系統(如Jira、ServiceNow)、成本管理(FinOps)或云管平臺(CMP)建設經驗者優先。
8. 熟悉DevOps理念與實踐,參與過云原生平臺建設者優先。