崗位職責:
1、底層能力構建:深耕模型訓練與調優底層技術,搭建高效、穩定的模型訓練框架,優化訓練流程與算法邏輯,夯實模型性能基礎。
2、微調技術攻堅:聚焦復雜業務場景,攻堅模型微調核心技術,針對不同場景特性設計定制化微調方案,解決微調過程中的過擬合、數據分布偏移等關鍵問題。
3、效果驗證與迭代:建立完善的微調效果評估體系,通過多維度指標量化模型性能,基于驗證結果持續迭代優化模型,確保模型輸出滿足復雜場景需求。
4、場景落地賦能:將優化后的 AI 模型與實際業務場景深度融合,提供技術支撐,推動模型從實驗室走向業務落地,實現技術價值轉化。
5、跨部門協作:與產品經理保持高頻次、高質量溝通,精準理解業務需求與產品目標,協同推進技術方案與產品規劃的對齊。
崗位要求:
1、精通深度學習框架(如 TensorFlow、PyTorch),具備扎實的模型訓練、調優理論基礎與實戰經驗。
2、熟練掌握各類模型微調技術(如 LoRA、QLoRA 等),有復雜場景下微調項目成功案例。
3、具備良好的數據分析能力,能夠設計合理的模型評估方案,定位并解決模型性能瓶頸。
4、具備較強的問題攻堅能力,能夠獨立解決復雜技術難題。
5、良好的溝通協作能力,能夠高效對接產品經理及業務團隊。
6、具備創新思維與持續學習能力,關注行業前沿技術動態并應用于實際工作。