1、負責信息系統日常維護與運維工作,開展日常巡檢、隱患排查及問題整改,保障系統基礎運行環境穩定;
2、負責系統全生命周期監控與優化,重點跟蹤性能瓶頸、容量負載、運行穩定性等核心指標,制定并執行調優方案,確保系統可用性與服務質量達標;
3、負責系統故障的診斷與閉環處理,協調跨部門 / 跨團隊資源定位故障根本原因,組織復盤分析并輸出標準化故障報告,推動問題根治與流程優化;
4、負責系統技術文檔的編寫與迭代,包括但不限于系統臺賬、拓撲架構圖、業務流程圖、部署實施方案、現場應急處置方案、接口交互清單及微服務清單,確保文檔的準確性與可讀性;
5、熟練掌握 CentOS、歐拉等主流 Linux 操作系統原理,能靈活運用系統操作命令完成環境配置、權限管理、性能排查等工作;
6、熟悉華為云 / 阿里云等公有云平臺的核心服務(如計算、存儲、網絡等)操作與應用部署,熟練使用 Kubernetes(K8s)命令行工具進行容器集群管理、資源調度及應用運維;
7、具備扎實的電力行業專業知識,熟悉電力業務場景及相關系統邏輯,能結合業務需求提供技術支撐的優先;
8、深入理解 PostgreSQL、MySQL、GaussDB、Redis 等數據庫的架構與原理,具備熟練的 SQL 語句編寫能力,能獨立完成數據庫性能優化、數據備份恢復及故障應急處置;
9、具備 Shell 腳本編寫與自動化運維能力,能通過腳本實現巡檢、監控、部署等重復性工作的自動化,提升運維效率;
10、具備強烈的責任心與高效的抗壓能力,擁有優秀的跨團隊溝通協調與合作意識;具備主動學習能力與問題攻堅思維,能快速響應技術挑戰并推動解決方案落地。