核心職責 (Core Responsibilities)
高可用性與服務保障: 負責全球代理節點(VLESS/Trojan/VMess等)的 7x24 小時穩定運行,通過持續優化確保服務的高可用性(High Availability)。
自動化運維體系建設: 設計并實現節點、面板、證書和數據庫的自動化部署、配置管理和生命周期管理,提高運維效率和一致性。
網絡架構與優化: 負責全球節點路由(BGP/CN2 GIA/隧道)的規劃、部署和持續優化,最大限度降低用戶延遲和丟包率。
安全防御與應急響應: 建立和維護網絡安全防護體系,包括 DDoS/CC 攻擊應對、服務器安全加固和突發故障的快速響應與處理。
監控與性能調優: 搭建和維護完善的監控(Prometheus/Grafana)及日志(ELK/Loki)系統,進行系統內核和代理應用層面的性能優化。
??? 核心技能要求 (Must-Have Technical Skills)
1. 代理與網絡協議
深入理解 VLESS、Trojan、VMess 等主流代理協議的工作原理、配置和優化技巧,有 Xray/Sing-box 等核心項目的實踐經驗。
精通 TCP/IP 協議棧,能夠理解和調優 TCP 擁塞控制算法(如 BBR)、MTU、路由表和防火墻(iptables/nftables)。
熟練掌握 TLS/SSL 證書管理,能夠實現自動化續期和配置,并理解流量偽裝(如 Reality/XTLS)機制。
具備 使用 tcpdump、mtr、netstat 等工具進行復雜網絡故障診斷和抓包分析的能力。
2. 自動化與基礎設施
精通 至少一種配置管理工具(如 Ansible),實現大規模節點的批量配置和維護。
熟悉 Linux 操作系統(Ubuntu/CentOS/Debian),具備深厚的 Shell 腳本編寫能力。
熟悉 容器化技術(Docker/Docker Compose)和虛擬化環境管理。
加分項: 具備使用 Terraform/Cloud-init 等工具進行基礎設施即代碼(IaC)的經驗。
3. 監控與安全
具備 搭建、維護 Prometheus + Grafana 監控報警系統的實戰經驗,能夠根據業務特點編寫自定義指標。
具備 DDoS/CC 攻擊防御和清洗的實戰經驗,熟悉主流高防服務(如 Cloudflare Magic Transit、阿里云高防)的接入和配置。
熟悉 Linux 系統安全加固策略、權限管理和審計。
?? 基本要求與軟性素質 (Qualifications & Soft Skills)
學歷經驗: 計算機科學、網絡工程相關專業背景優先,具備 2-4 年 互聯網公司或網絡服務 SRE/運維經驗。
責任心強: 對服務的高可用性有強烈的責任感,具備在壓力下快速決策和解決問題的能力。
獨立工作能力: 能夠獨立承擔并完成復雜的運維任務,具備良好的學習能力和技術鉆研精神。
工作時間: 必須接受并能夠適應 7x24 小時輪值待命(On-call),及時處理緊急故障。
分布式辦公 分布式辦公