崗位職責:
1。負責多個應用系統運維工作,主要包括日常維護,告警處置,安裝部署,遷移,擴縮容,性能調優等,保障業務安全穩定運行;
2。從應用運維角度對所管轄應用的任何改動或操作進行風險評估;
3。分析系統下出現的系統,應用,數據庫,網絡等故障,并提出相應解決方案;
4。負責追蹤或解決應用生命周期中遇到的故障異常,性能瓶頸等相關疑難問題處理;
5。制定系統監控方案,確定監控指數,制定應急處理預案,確保環境穩定安全可靠;
6。協助完成服務器資源調度,確保各項目有序進行;
7。推進日常工作的自動化與相關規范流程的制訂,驅動并優化業務,運維流程,提高服務運行質量;
8。負責應用小需求迭代開發,各類運維文檔及相關工作技術文檔的撰寫工作。
崗位要求:
1。計算機及相關專業及本科以上學歷,5年以上多個運維經驗
2。熟練掌握Linux常用命令,對其內核原理,文件系統,進程調度,網絡棧有深入理解
3。熟練使用Shell,Python一種或多種腳本語言,能快速編寫腳本處理日常重復性工作;熟悉Nginx,Redis,RocketMQ,ELK,HAproxy,Keepalive,Docker的選型,配置要點,部署和維護;
4。熟練使用Prometheus,Zabbix等,能設計有業務意義的指標和告警。
5。精通ELK/EFK或Loki棧,進行集中化日志管理和分析。
6。了解OpenTelemetry,Jaeger,SkyWalking等分布式追蹤工具。
7。了解Jenkins,Ansible,Git等自動化工具的使用;
8。理解不同數據庫(MySQL,PostgreSQL,Redis,MongoDB等)的核心原理,高可用方案,備份恢復和性能優化9。有一定的編程能力,有java開發經驗者優先