崗位要求:
1、熟練使用Linux/unix(centos、ubuntu)、Windows操作系統或者國產系列等主流操作系統(AnolisOS/openEuler)。
2、熟悉網絡協議(TCP/IP/HTTP/DNS)和常見網絡設備配置,有良好的網絡、存儲、安全、計算機體系結構方面的知識。
3、精通Shell/Python/Go等至少一門腳本語言,實現自動化運維。
4、深入理解Kubernetes/Docker架構,具備集群搭建、故障處理及性能優化能力。
5、熟悉微服務架構(如SpringCloud)及相關組件(注冊中心、消息中間件)。
6、掌握MySQL/Oracle/SQL Server/PostgreSQL/OpenGauss/Redis/Elasticsearch等主流數據庫的主從架構、運維、SQL優化及備份恢復。
7、熟悉Nginx/Redis/Kafka/RocketMQ/Tomcat等中間件的配置與調優。
8、熟悉CI/CD流程(GitLab/Jenkins/Ansible工具),具備二次開發經驗者優先。
9、熟悉主流開源的服務監控、預警平臺的搭建使用。
10、熟悉灰度、藍綠、雙活等部署方式及數據同步、備份、遷移的機制和原理。
11、熟練使用相關日志收集工具和測試工具(如GPU壓測工具),進行故障分析、診斷及壓測異常處理。
12、具備自動化運維能力、系統均衡容災設計、故障響應能力、優化資源使用率、有大型集群維護經驗者優先。
二、崗位職責
1、系統與服務運維
參與公司整體 IT 基礎設施建設與運維。
負責服務器、本地資源的部署、維護、監控與性能調優,保障系統高可用性和穩定性。
管理容器化環境(如Kubernetes/Docker),處理日常故障、性能優化及資源調度。
維護操作系統(Linux/Windows)、中間件、數據庫(MySQL、Oracle、PostgreSQL、OpenGauss、Redis等)及微服務組件(如Nacos、Kafka、RocketMQ)。
2、運維流程與工具鏈
優化生產發布流程(如藍綠/灰度發布),降低發布風險。
維護監控告警體系(如Prometheus/Zabbix/ELK)、日志系統及DevOps工具鏈(如GitLab/Jenkins/Ansible)。
開發自動化腳本(Shell/Python)和運維工具,提升運維效率。
3、基礎設施與安全
管理網絡架構(如DNS/CDN/LVS)、負載均衡及高可用集群(如Keepalived/Nginx)。
落實安全規范,執行漏洞掃描、備份恢復、訪問控制及容災方案。
支持高性能計算集群和大模型平臺的部署與運維。
4、技術支持與文檔
提供客戶技術支持,解決系統使用問題,完成培訓及項目驗收。
輸出運維文檔(SOP、報告)、優化方案,并具備跨團隊溝通能力。