崗位職責:
1.負責IT運維領域人工智能大模型的微調訓練,包括數據準備、模型調優、效果評估及迭代優化;
2.設計并搭建大模型訓練框架,優化訓練效率和資源利用率,解決分布式訓練中的技術難點;
3.參與智能體(Agent)的開發與實施,將大模型能力嵌入實際運維場景(如自動化故障診斷、日志分析等);
4.跟蹤行業最新算法與技術(如RLHF、Prompt工程),推動模型性能提升;
5.撰寫技術文檔,沉淀方法論,指導團隊完成模型部署與維護。
任職要求:
1.計算機、數學、統計學等相關專業本科及以上學歷;
2.精通PyTorch/TensorFlow等深度學習框架,熟悉Hugging Face、LangChain等工具生態;
3.具備NLP/CV/多模態大模型微調經驗,熟悉LoRA、P-tuning等參數高效微調技術;
4.熟悉IT運維領域知識(如Zabbix、Prometheus等監控工具)者優先;
優秀的編程能力(Python/Scala),有分布式訓練(如DeepSpeed、Megatron-LM)經驗者優先。