崗位職責:
1.負責大規模預訓練模型(LLM)的設計、開發、訓練及調優,包括架構創新、參數效率提升等;
2.負責數據處理與工程化,構建高質量多模態訓練數據集,設計數據清洗、增強及標注策略等;
3.負責模型部署與性能優化,實現模型的高效推理部署,優化GPU/TPU資源利用率,研究模型服務化方案(如API服務、邊緣端部署),解決延遲、吞吐量等性能瓶頸;
4.與產品、業務團隊深度合作,將技術能力轉化為實際應用場景,撰寫技術文檔、專利及論文,推動團隊技術影響力。
任職資格:
1.計算機科學、軟件工程、數學或相關領域統招本科及以上學歷;
2.3年以上算法研發經驗,精通PyTorch框架,且滿足下列條件之一:
- 大模型(10B+參數)訓練/微調實戰經驗,深入理解Transformer、注意力機制、RLHF等核心技術,具備模型源碼級調優能力。理解RAG技術鏈實現邏輯,有自研RAG算法能力;
- 熟悉Megatron-LM、DeepSpeed等分布式訓練工具,熟練使用CUDA、TensorRT等加速庫,具有模型優化部署能力;
- 熟悉計算機視覺領域,有分類/檢測/分割的實際落地項目經驗。熟悉傳統圖像算法;
- 熟悉運籌優化算法理論,有人員排班/車輛路徑規劃等項目經驗。
3.熟悉發明專利的撰寫規范,有相應經驗者優先。