崗位職責:
1.負責大規模預訓練模型的研發工作,包括架構設計、訓練優化、分布式加速等核心技術攻關 ;
2.主導大模型在具體業務場景(NLP/CV/多模態/生理信號等)的應用落地,設計創新解決方案 ;
3.構建模型微調、提示工程、模型壓縮等工業化應用技術體系;
4.與產品、數據、工程團隊緊密協作,推動算法到產品的全流程落地 ;
5.跟蹤學術界與工業界前沿技術動態,探索大模型領域創新方向 。
任職要求:
【硬性條件】
1.計算機/數學/ 人工智能相關專業統招碩士及以上學歷 ;
2.兩年以上大模型及五年以上AI算法相關研發經驗 ;
3.深入理解Transformer/BERT/GPT等架構,掌握PyTorch/TensorFlow框架
4.具備分布式訓練實戰經驗(Megatron/DeepSpeed/FairScale等) ;
5.熟悉主流大模型技術棧(LangChain/LLAMA/擴散模型等)。
【核心能力】
1.扎實的算法基礎:精通 機器學習 / 深度學習 理論,代碼實現能力強(LeetCode中級以上);
2.工程落地能力:具有億級參數模型訓練調優經驗,熟悉模型服務化部署
3.業務洞察力:能準確理解業務需求,設計合理的模型應用方案 ;
4.團隊協作力:優秀的跨團隊溝通能力,能有效協調多方資源推進項目。
優先條件:
△在ACL/NeurIPS/CVPR等頂會發表過相關論文
△有開源項目核心貢獻或Kaggle等競賽top成績
△具備多模態大模型/強化學習/知識圖譜交叉經驗
△熟悉中醫/醫療/ 生物醫藥 等垂直領域知識者優先
此職位為專家方向和工程師職位同步招聘,通過面試情況定崗,專家級直接匯報總裁,薪酬OPEN可再溝通