思必馳發布始終在線、低功耗 AI 芯片,AI 交互智能生態布局初顯規模

思必馳低功耗算法方案:實現設備從低功耗喚醒、到喚醒驗證、再到聲紋識別的多級喚醒
低功耗語音喚醒的應用不僅在耳機、手表、小家電等消費電子產品領域有著豐富的應用,在物流配送、專車駕駛、餐飲服務等 toB 的垂直場景,也有巨大的需求空間。
近年來,在運動、車載、商超、地鐵、公交等隨行場景,我們看到了越來越多的設備增加了語音交互的功能。
應用場景的變化,對于語音喚醒的快速和靈活反應,以及功耗和算力,甚至硬件設備本身的結構設計,都提出了新的要求。
在算法層面,思必馳提供了從 DSP 到 AP 的一整套集成方案,包括雙麥定向波束、命令詞檢測、骨傳導特征檢測等多項技術方案,實現設備從低功耗喚醒、到喚醒驗證、再到聲紋識別的多級喚醒。
通常情況下,語音喚醒的算法運行在 DSP 中,因語音交互而產生的數據也在 DSP 上緩存,通過獨立的麥克風做喚醒輸入,經過數據交換,將緩存數據輸送到 AP 中,再觸發二級喚醒和聲紋驗證。
而在設備處于待機或休眠的超低功耗狀態,或者當設備在播放音樂時,就會自動切換到「闖入模式」,語音數據也會直接傳輸給 AP 芯片,觸發二級喚醒和聲紋驗證,實現低功耗算法中的回聲消除(AEC)。

基于以上工作流程,要做到「實時在線」的語音喚醒,在算法的基礎上,還需要在麥克風陣列、定向波束、命令詞檢測、骨傳導特征檢測、藍牙傳輸協議、以及云端多個方面進行優化。
在麥克風陣列的聲學結構設計方面,有很多「Know-How」學問。比如市面上常見的雙麥克風結構設計,需要做線性分布和水平放置,最佳間距為 30mm,聲音流向要與麥克風垂直,麥克風拾音孔要水平朝上且處于同一平面,收音腔設計除了單孔型還有網狀自由場型,隔音減震設計也有講究,等等。思必馳的工程師會協助客戶完成從麥克風選型到麥克風參數評估的方方面面。
設備有了「聽清」的能力后,就要解決命令詞也就是「聽懂」的問題。拿藍牙耳機產品來舉例,類似播放/暫停音樂、撥打/掛斷電話、支付寶掃一掃這樣的操控命令,甚至一些品牌命令詞,都可以直接儲存到設備上,在設備上直接完成調用。

△ 思必馳低功耗算法方案
最后在協議層,思必馳也提供了 SMA 藍牙配件接入協議,賦予思必馳全鏈路語音交互技術,通過曉聽 APP,實現控制家電、場景識別等個性化功能。
低功耗語音喚醒的應用不僅在耳機、手表、小家電等消費電子產品領域有著豐富的應用,在物流配送、專車駕駛、餐飲服務等 toB 的垂直場景,也有巨大的需求空間。

順豐「小豐」也是思必馳「曉聽」FreeSpeech E1 的應用案例,該方案集成了雙麥定向增強與降噪、免提語音交互等多項技術,并可以實現 30KM/H 降風噪,始終在線功耗小于 2mA,以及 12 小時的連續高清通話。
具體到「小豐」耳機,則是基于主頻算力小的小型 NCU,思必馳提供了基于雙麥的 ANC 喚醒方案以及前端信號處理、低功耗喚醒等技術,將快捷命令詞納入喚醒詞中,既大大提高語音交互的效率,又確保了低功耗。
題圖:思必馳低功耗模組
編輯:森林木 / 深圳灣