崗位職責:
1. 負責大模型(如LLM、多模態模型)的算法研發、優化及工程化落地,包括模型架構設計、預訓練、指令微調、對齊優化等關鍵技術環節。
2. 針對業務場景(如NLP、搜索推薦、對話系統、AIGC等)設計大模型應用方案,提升模型效果與性能。
3. 探索大模型的高效訓練與推理技術,包括分布式訓練、模型壓縮、量化部署、低資源適配等方向。
4. 利用LLM前沿技術方向,負責AI內容生成和編輯(prompt設計、大模型SFT和預訓練,大模型強化學習等)、內容理解和質量識別(質量分級、內容結構化、智能標簽/摘要等)、場景應用(需求理解、用戶刻畫、個性化推薦)等
任職要求
1. 本科以上學歷,5年以上工作經驗,2年以上機器學習,深度學習,NLP,圖像識別等相關開發經驗,1年以上大模型(參數量≥10B)相關項目經驗。。
2. 扎實的機器學習和深度學習基礎,熟悉主流大模型架構(如Transformer、BERT、GPT、LLaMA、DeepSeek、Diffusion等)。
3. 精通PyTorch/TensorFlow等框架,具備大模型訓練調優經驗(數據清洗、Prompt工程、LoRA/QLoRA等微調技術)。
4. 熟悉大模型相關技術鏈:分布式訓練(DeepSpeed、Megatron)、推理加速(vLLM、TensorRT)、評估對齊(RLHF、DPO)等。
5. 具備優秀編碼能力,熟練掌握Python/C++,熟悉Linux開發環境及高性能計算優化。
6. 具備大模型應用開發經驗(Agent、RAG、知識庫增強等)。
加分技能:
1) 熟悉大模型生態工具鏈(LangChain、LangGraph、HuggingFace、LlamaIndex等),或有開源項目貢獻經驗。
2) 掌握CUDA編程、模型量化(INT8/FP16)、服務化部署(Docker、Kubernetes)等技術
簡歷投遞郵箱:*****************
聯系人:張經理