### 核心工作職責:
1. **服務版本迭代管理:**
- 負責公司核心服務的**發布流程制定、執行與優化**,確保發布過程安全、高效、可追溯。
- 管理代碼分支策略,協調開發、測試、產品團隊,**保障版本按時、高質量上線**。
- 制定和執行發布計劃、回滾預案,處理發布過程中的異常情況。
2. **系統運維保障:**
- 及時響應并**高效處理線上故障、性能瓶頸及安全事件**,進行根因分析并推動改進。
- 執行系統日常巡檢、維護、備份與恢復操作,確保數據安全與系統健康。
- 負責服務器、網絡、存儲等基礎設施的**容量規劃、資源管理及優化**。
3. **自動化運維:**
- 積極推動和應用**自動化運維工具和技術**,提升運維效率(如:配置管理 Ansible/SaltStack/Puppet、腳本自動化 Python/Shell 等)。
- 參與或主導運維工具鏈的開發與維護,減少重復性操作。
4. **文檔與協作:**
- 編寫和維護清晰的技術文檔(如:運維手冊、部署文檔、應急預案)。
- 與開發團隊緊密協作,推動可運維性設計,促進DevOps文化落地。
- 參與制定和優化運維流程規范。
### 必備技能與經驗要求:
1. **扎實的Linux基礎:** 精通 Linux 操作系統(如 CentOS, Ubuntu)的配置、管理和排障。
2. **版本迭代與發布管理:** 深刻理解軟件開發生命周期,**具備豐富的 CI/CD 實踐經驗**(熟悉 Jenkins, GitLab CI, GitHub Actions, ArgoCD 等至少一種)。
3. **腳本與自動化能力:** 熟練掌握 **Shell 腳本**,具備 **Python** 或其他腳本語言能力進行自動化開發。
4. **中間件與數據庫運維基礎:** 了解 Nginx/Apache、Tomcat 等應用服務器的配置與優化;**了解 MySQL** 等關系型數據庫的基礎運維(安裝、備份恢復、性能監控)。
5. **網絡基礎:** 理解 TCP/IP, HTTP/HTTPS, DNS 等網絡協議,具備基本的網絡排障能力。
6. **強烈的責任心與穩定性意識:** 對系統穩定性有極高的追求,能承受一定壓力,具備優秀的應急響應能力。
7. **良好的溝通協作能力:** 能與開發、測試、產品等跨職能團隊有效協作。
8.能夠接受出差。