国产主播第一页,亚洲中文AV,天堂一区在线观看

登錄/注冊我要招人

400-885-9898

更新于 1月10日

APP

舉報

語音感知交互工程師

2-2.5萬

成都雙流區(qū)
3-5年
本科
全職
招1人

職位描述

語音處理

崗位職責：
1.核心算法研發(fā)與迭代
負責機器人語音交互關鍵技術的研究與開發(fā)，包括語音識別（ASR）、語音分離與增強、語音合成（TTS）、關鍵詞喚醒（KWS）、聲紋識別、聲源定位、異常聲音識別等方向。
持續(xù)優(yōu)化算法在復雜場景下的識別率、實時性、魯棒性與資源占用，提升用戶體驗。
跟進語音領域前沿技術，推動適合產(chǎn)品需求的創(chuàng)新算法落地。
2.算法工程化與系統(tǒng)部署
主導語音算法從原型到產(chǎn)品級的工程實現(xiàn)，完成模型輕量化、推理加速與多平臺（如嵌入式、移動端、CPU/GPU）適配。
設計高可用的語音處理Pipeline，支持低延遲、高并發(fā)的實時交互場景。
與軟件、硬件團隊協(xié)同完成算法集成、聯(lián)調(diào)與性能優(yōu)化，確保系統(tǒng)穩(wěn)定交付。
3.數(shù)據(jù)體系建設與效能提升
構(gòu)建高效的數(shù)據(jù)閉環(huán)系統(tǒng)，覆蓋數(shù)據(jù)采集、標注、清洗、增強與管理流程，提升數(shù)據(jù)驅(qū)動的算法迭代效率。
針對業(yè)務場景進行數(shù)據(jù)分析與挖掘，定向優(yōu)化模型泛化能力和場景適應性。
4.技術沉淀與創(chuàng)新
撰寫算法設計文檔、實驗報告與技術總結(jié)，推動團隊知識共享。
結(jié)合研發(fā)成果，進行核心技術專利的規(guī)劃與申請。

任職要求：
基本要求：
1.本科及以上學歷，計算機、人工智能、電子信息、數(shù)字信號處理、應用數(shù)學等相關專業(yè)，3年以上語音算法研發(fā)與落地經(jīng)驗。
2.扎實的語音信號處理和機器學習基礎，熟悉至少一個主流深度學習框架（如PyTorch、TensorFlow）。
3.在以下至少一個方向有實際項目經(jīng)驗：語音識別（ASR）、語音合成（TTS）、語音分離/增強、關鍵詞喚醒（KWS）等。
4.具備較強的算法工程化能力，熟悉模型優(yōu)化、壓縮、加速及端側(cè)部署（如TensorRT、ONNX、端側(cè)推理框架等）。
5.熟練掌握Python/C++，具備良好的代碼工程能力和系統(tǒng)調(diào)試能力。
6.具備良好的溝通協(xié)作能力和文檔習慣，能推動算法在復雜系統(tǒng)中落地。

加分項：
1.具備嵌入式/移動端語音算法部署和性能調(diào)優(yōu)經(jīng)驗，熟悉ARM/NEON指令優(yōu)化。
2.有大規(guī)模語音數(shù)據(jù)處理經(jīng)驗，熟悉數(shù)據(jù)閉環(huán)構(gòu)建與數(shù)據(jù)策略設計。
3.在語音相關頂會（如INTERSPEECH、ICASSP等）發(fā)表過論文，或有開源項目貢獻。
4.了解多模態(tài)交互、自然語言處理（NLP）相關技術，具備跨領域整合經(jīng)驗。
5.有機器人、智能硬件、車載語音等實際產(chǎn)品語音系統(tǒng)開發(fā)經(jīng)驗者優(yōu)先。