崗位職責:
1.核心算法研發(fā)與迭代
負責機器人語音交互關鍵技術的研究與開發(fā),包括語音識別(ASR)、語音分離與增強、語音合成(TTS)、關鍵詞喚醒(KWS)、聲紋識別、聲源定位、異常聲音識別等方向。
持續(xù)優(yōu)化算法在復雜場景下的識別率、實時性、魯棒性與資源占用,提升用戶體驗。
跟進語音領域前沿技術,推動適合產(chǎn)品需求的創(chuàng)新算法落地。
2.算法工程化與系統(tǒng)部署
主導語音算法從原型到產(chǎn)品級的工程實現(xiàn),完成模型輕量化、推理加速與多平臺(如嵌入式、移動端、CPU/GPU)適配。
設計高可用的語音處理Pipeline,支持低延遲、高并發(fā)的實時交互場景。
與軟件、硬件團隊協(xié)同完成算法集成、聯(lián)調(diào)與性能優(yōu)化,確保系統(tǒng)穩(wěn)定交付。
3.數(shù)據(jù)體系建設與效能提升
構(gòu)建高效的數(shù)據(jù)閉環(huán)系統(tǒng),覆蓋數(shù)據(jù)采集、標注、清洗、增強與管理流程,提升數(shù)據(jù)驅(qū)動的算法迭代效率。
針對業(yè)務場景進行數(shù)據(jù)分析與挖掘,定向優(yōu)化模型泛化能力和場景適應性。
4.技術沉淀與創(chuàng)新
撰寫算法設計文檔、實驗報告與技術總結(jié),推動團隊知識共享。
結(jié)合研發(fā)成果,進行核心技術專利的規(guī)劃與申請。
任職要求:
基本要求:
1.本科及以上學歷,計算機、人工智能、電子信息、數(shù)字信號處理、應用數(shù)學等相關專業(yè),3年以上語音算法研發(fā)與落地經(jīng)驗。
2.扎實的語音信號處理和機器學習基礎,熟悉至少一個主流深度學習框架(如PyTorch、TensorFlow)。
3.在以下至少一個方向有實際項目經(jīng)驗:語音識別(ASR)、語音合成(TTS)、語音分離/增強、關鍵詞喚醒(KWS)等。
4.具備較強的算法工程化能力,熟悉模型優(yōu)化、壓縮、加速及端側(cè)部署(如TensorRT、ONNX、端側(cè)推理框架等)。
5.熟練掌握Python/C++,具備良好的代碼工程能力和系統(tǒng)調(diào)試能力。
6.具備良好的溝通協(xié)作能力和文檔習慣,能推動算法在復雜系統(tǒng)中落地。
加分項:
1.具備嵌入式/移動端語音算法部署和性能調(diào)優(yōu)經(jīng)驗,熟悉ARM/NEON指令優(yōu)化。
2.有大規(guī)模語音數(shù)據(jù)處理經(jīng)驗,熟悉數(shù)據(jù)閉環(huán)構(gòu)建與數(shù)據(jù)策略設計。
3.在語音相關頂會(如INTERSPEECH、ICASSP等)發(fā)表過論文,或有開源項目貢獻。
4.了解多模態(tài)交互、自然語言處理(NLP)相關技術,具備跨領域整合經(jīng)驗。
5.有機器人、智能硬件、車載語音等實際產(chǎn)品語音系統(tǒng)開發(fā)經(jīng)驗者優(yōu)先。