崗位職責:
1、負責服務器(物理機/云主機)、網絡、存儲等基礎設施的部署、配置和維護;
2、管理云計算資源(AWS/Azure/阿里云/騰訊云),優化成本與性能,維護高可用架構(負載均衡、集群、容災備份);
3、使用CI/CD工具(Jenkins/GitLab CI/CD)實現自動化構建、測試、部署;
4、開發運維腳本(Shell/Python)提升效率,如日志分析、自動擴縮容;
5、搭建監控系統(Prometheus+Grafana)實現實時告警;
6、快速響應線上故障,進行根因分析(RCA)并優化系統;
7、實施安全策略(防火墻、WAF、漏洞掃描、權限管理),符合行業合規要求(如GDPR、等保2.0、ISO27001),定期進行安全審計、滲透測試和應急演練;
8、與開發團隊協作,優化應用架構(微服務、無狀態化),編寫技術文檔(運維手冊、故障處理流程、應急預案)。
任職要求:
1、熟悉Linux/Windows服務器管理(Shell/PowerShell),掌握TCP/IP、HTTP/HTTPS、DNS、CDN等網絡協議,熟練使用 Nginx/Apache、MySQL/PostgreSQL、Redis/MongoDB等中間件;
2、熟練使用Jenkins/GitLab CI/GitHub Actions搭建CI/CD流水線,熟悉IaC(Terraform/Ansible)管理云資源;
3、熟悉Prometheus+Grafana、Zabbix、ELK(Elasticsearch+Logstash+Kibana),了解分布式追蹤(Jaeger、SkyWalking)和APM(New Relic、Datadog);
4、熟悉至少一家主流云平臺(AWS/Azure/阿里云/華為云);
5、熟悉WAF、IDS/IPS、零信任架構,有安全加固、漏洞掃描(Nessus/OpenVAS)經驗者優先;
6、能快速定位線上問題(如性能瓶頸、網絡延遲),適應7×24小時應急響應,處理突發故障,與開發、測試、產品團隊緊密配合,推動運維優化;
7、具備良好的執行能力、溝通協調能力、團隊合作能力、責任心和抗壓能力;
8、可以接受應屆生和實習生。