何止 Meta x Oakley,小米等十家 AI 拍攝眼鏡上新!下半年好看!

出門問問 TWS 耳機語音交互解決方案
出門問問 TWS 耳機解決方案是一套高集成度可定制化的 TWS 語音交互軟硬件解決方案。
隨著芯片、算法商在技術及應用方面的演進,尤其是連接、降噪方向的重大突破,越來越多的手機及耳機廠商推出了自家功能豐富、交互舒適的 TWS 耳機。
近日,出門問問新品發布會上推出的 TicPods 2 系列產品,在人機交互和語音助理方面,展現出了不少創新的交互及技術亮點:采用了多種手勢的觸控、頭部控制、及語音喚醒和快捷口令;手表 + 手機的交互組合,將 4G 獨立通訊的智能手表和耳機聯動,在脫離手機終端的獨立場景中,實現通訊、音頻內容點播、翻譯對講、生活查詢等一系列智能應用;結合場景做精細打磨,整合了更豐富的云端內容和服務,結合「小問秘書」、「小問翻譯對講機」、「小問電話助手」等智能應用,使產品的可玩性大大提高。
這也個傳統耳機廠商及 TWS 耳機廠商,開拓了更廣闊的視野。
出門問問 TWS 耳機解決方案是一套高集成度可定制化的 TWS 耳機語音交互解決方案,為便于查閱,以下將稱 “出門問問 TWS 耳機語音交互解決方案” 為 “方案”。
方案整體架構
支持平臺:高通 QCC5100 系列、ARM M4

方案核心技術及算法
回聲消除(AEC)?
在聽音樂和 TTS 語音播報的時候識別喚醒詞和命令詞是一個必不可少的功能,這個時候回聲就是一個需要解決的問題。而就回聲消除而言,則需要從結構和算法兩個方面來考慮。
算法支持:需優先考慮聲學結構方面的優化以減少回聲的強度,在此基礎之上可以透過出門問問回聲消除算法,進一步降低回聲的影響。
雙麥波束成形(Beamforming)
利用兩個麥克風采集到的語音的相位差做處理實現定向拾音,增強耳機佩戴人的語音并且抑制環境干擾和噪音,可以實現即使在噪雜的環境下也能實現很高的喚醒識別率。
算法支持:建議兩個麥克風上下排列,麥克風的連線指向嘴巴,兩個麥克風的間距在 25mm 到 30mm 之間為最優。
降噪(Noise Suppression)
雙麥的波束成形算法已經具備了一定的環境噪音的抑制,在此基礎之上降噪算法可以進一步地抑制環境噪音。
算法支持:結合波束成形和降噪算法,我們可以提供 20dB 以上的綜合降噪水平。
喚醒詞和命令詞識別(Wakeup Word & Command Words Detection)
在語音交互中為了降低系統的功耗以及減少無效識別,一般都有一個定制的喚醒詞(如蘋果的 “Hey Siri”)。當系統檢測到喚醒詞之后,才進入語音識別和交互的過程。除了喚醒詞之外,還有一些常用的與音樂播放、接聽電話、音量控制等相關的命令。這些命令因 為比較常用,理想情況下用戶可以直接說命令詞而無需先說喚醒詞。
算法支持:目前出門問問的算法可以支 持以下中英文快捷命令詞,并可以為客戶提供定制化需求開發。
方案集成及定制功能
可與產品廠商在提供 TWS 耳機核心算法及技術的基礎上共同參與硬件結構設計,可提供:
- 根據硬件設備定制喚醒詞、命令詞以及手機二次喚醒驗證、聲紋識別方案,提供數據錄制;
- 通過優化聲學結構減少計算開銷和功耗,以及相應優化功能;(對于典型的雙麥降噪 + 熱詞喚醒的場景下,算法的內存占用只有 70KB,包括喚醒詞模型和所有計算需要的內存。)

方案開放程度
- 耳機端的語音交互核心算法:開放支持
- 耳機和手機通過藍牙互聯互動的私有協議:開放支持
- 手機端的喚醒詞命令詞的二步驗證:開放支持
- 手機端的嵌入式語音識別、語音合成系統:開放支持
- 云端的語音識別、語義理解、對話管理、語音合成,以及第三方的內容和服務集成:開放支持
- 聲學結構設計和芯片選型方面聯合開發:開放支持
- 用戶體驗及相關體驗設計:開放支持
方案性能指標測試
主要針對語音交互核心算法進行測試:



方案優勢
- 算法性能上的優勢;
- 資源占用上的優勢;
- 完整的技術解決方案,尤其在系統集成和優化上具有優勢;