崗位職責:
1. 面向人工智能、科學計算與大數據處理融合的智能體系結構,開展大規模預訓練模型相關研究。包括但不限于數據清洗、算法設計、訓練推理、模型壓縮等研究方向。
2. 與團隊成員協同工作,設計實現各種模塊或功能,并進行性能調優;解決大規模預訓練模型研發過程中遇到的算法問題,如進行模型評測、緩解模型幻覺等。
3. 探索創新:積極探索新方法、不斷提升工作效率及團隊協調開發能力。
任職要求:
1.碩士及以上學歷,計算機科學與技術專業優先, 計算機/人工智能/大數據/知識工程/電子信息/通信等相關專業優先。
2.良好的編程風格與文檔撰寫能力,有多人協作開發及 Code Review 經驗,對代碼有嚴格的質量要求;熟悉常見開發規范,熟悉git等開發工具,熟悉代碼庫的創建與維護操作。
3.掌握深度學習基礎知識,至少熟悉一種深度學習編程框架,如PyTorch、Tensorflow、Paddle、MindSpore等,有模型開發、部署、微調經驗。
4. 對Transformer、深度學習有一定深度的理解和經驗,能根據論文復現相關算法,有大規模預訓練模型研發和訓練經驗者優先;高質量相關論文ACL,EMNLP,COLING,NAACL作者優先。