崗位職責
1. 負責公司大模型的微調工作,依據業務場景與需求,優化模型性能,提升模型在特定任務上的表現。
2. 參與構建和優化大模型微調流程,從數據預處理、模型選擇、超參數調整到模型評估,確保每個環節高效運行。
3. 分析和理解業務數據,挖掘數據價值,設計并執行數據增強策略,提高模型的泛化能力與適應性。
4. 跟蹤大模型領域的前沿技術,持續探索新的微調方法和策略,將其應用于實際項目中,推動技術創新。
5. 與產品團隊緊密合作,理解產品需求,提供技術支持,確保大模型在產品中的有效應用。
任職資格
1. 學歷與專業:計算機科學、人工智能、數學等相關專業,碩士及以上學歷優先。
2. 工作經驗:3年以上大模型微調或相關工作經驗,有成功的大模型微調項目案例。
3. 技術能力:
- 深入理解機器學習、深度學習原理,熟悉Transformer架構及其變體,如BERT、GPT、T5等主流模型架構。
- 熟練掌握大模型微調技術,如Prompt Tuning、LoRA、P - tuning等,并能根據實際任務靈活選擇和應用。
- 精通Python編程語言,熟悉PyTorch或TensorFlow深度學習框架,以及Deepspeed、Accelerate等大模型訓練工具鏈。
- 熟悉常見的啟發式算法,運籌優化算法。
- 熟悉Hugging Face、LangChain等開源生態,能夠利用開源工具和模型快速實現大模型的微調與應用。
- 掌握分布式訓練、模型并行與混合精度優化方法,能夠在多GPU環境下高效訓練大模型。
4. 算法與實踐:具備扎實的算法功底,能獨立復現前沿論文中的算法和模型,有千億參數模型訓練經驗者優先。
5. 其他能力:具有良好的團隊合作精神和溝通能力,能夠適應快速迭代的工作環境,具備較強的學習能力和問題解決能力 。