崗位職責:
1.核心算法研發與迭代
負責機器人語音交互關鍵技術的研究與開發,包括語音識別(ASR)、語音分離與增強、語音合成(TTS)、關鍵詞喚醒(KWS)、聲紋識別、聲源定位、異常聲音識別等方向。
持續優化算法在復雜場景下的識別率、實時性、魯棒性與資源占用,提升用戶體驗。
跟進語音領域前沿技術,推動適合產品需求的創新算法落地。
2.算法工程化與系統部署
主導語音算法從原型到產品級的工程實現,完成模型輕量化、推理加速與多平臺(如嵌入式、移動端、CPU/GPU)適配。
設計高可用的語音處理Pipeline,支持低延遲、高并發的實時交互場景。
與軟件、硬件團隊協同完成算法集成、聯調與性能優化,確保系統穩定交付。
3.數據體系建設與效能提升
構建高效的數據閉環系統,覆蓋數據采集、標注、清洗、增強與管理流程,提升數據驅動的算法迭代效率。
針對業務場景進行數據分析與挖掘,定向優化模型泛化能力和場景適應性。
4.技術沉淀與創新
撰寫算法設計文檔、實驗報告與技術總結,推動團隊知識共享。
結合研發成果,進行核心技術專利的規劃與申請。
任職要求:
基本要求:
1.本科及以上學歷,計算機、人工智能、電子信息、數字信號處理、應用數學等相關專業,3年以上語音算法研發與落地經驗。
2.扎實的語音信號處理和機器學習基礎,熟悉至少一個主流深度學習框架(如PyTorch、TensorFlow)。
3.在以下至少一個方向有實際項目經驗:語音識別(ASR)、語音合成(TTS)、語音分離/增強、關鍵詞喚醒(KWS)等。
4.具備較強的算法工程化能力,熟悉模型優化、壓縮、加速及端側部署(如TensorRT、ONNX、端側推理框架等)。
5.熟練掌握Python/C++,具備良好的代碼工程能力和系統調試能力。
6.具備良好的溝通協作能力和文檔習慣,能推動算法在復雜系統中落地。
加分項:
1.具備嵌入式/移動端語音算法部署和性能調優經驗,熟悉ARM/NEON指令優化。
2.有大規模語音數據處理經驗,熟悉數據閉環構建與數據策略設計。
3.在語音相關會議(如INTERSPEECH、ICASSP等)發表過論文,或有開源項目貢獻。
4.了解多模態交互、自然語言處理(NLP)相關技術,具備跨領域整合經驗。
5.有機器人、智能硬件、車載語音等實際產品語音系統開發經驗者優先。