AI 全面落地,詳解聲智科技全鏈條操作系統 SoundAI Azero | WARE 2019

大象聲科發布新一代 TWS 通話降噪方案,現場演示效果超 AirPods | WARE 2019
引領基于深度學習的新一代信號處理技術
今年,隨著蘋果、PowerBeats、索尼、Bose 等新一代耳機陸續推出,各大廠家搶灘 TWS 真無線藍牙耳機市場的競爭更加激烈了。
當 TWS 解決穩定連接的基本問題后,降噪體驗成為重要賣點。這里的降噪體驗不僅包含耳機使用者本人在噪音下的聆聽體驗,還包括通話時對方的聆聽體驗。
在通話降噪技術上,大象聲科將深度學習引入信號處理領域,率先實現了單麥克風降噪,并將這一先進的 AI 智能通話降噪方案,應用于智能手機和 IoT 設備。
7 月 19 日,在由深圳灣主辦的 WARE2019 新硬件峰會上,大象聲科創始人兼 CEO 苗健彰介紹了大象聲科基于深度學習的新一代信號處理技術,分享了大象聲科智能語音增強和語音交互方案在手機、耳機、IoT 等領域的應用,并在現場發布和展示了大象聲科新一代基于 AI 和骨傳導的藍牙耳機通話降噪方案。
新一代 TWS 通話降噪方案
通話質量目前是市面上大多數 TWS 耳機的軟肋。大象聲科新一代耳機通話降噪方案,將AI 智能通話降噪技術與骨傳導傳感器高效結合,可實現人聲和背景噪聲分離提取,覆蓋低信噪比全場景,不論是在地鐵、商場、KTV,還是風噪場景,都能大幅提升通話清晰度。
一般來說,Mems 麥克風的降噪成本并不便宜,而大象聲科的 AI+bone sensor 通話降噪方案,僅需要一顆麥克風,能夠提高工程效率的同時,大大節省硬件成本。
在地鐵和 KTV 等超低信噪比的場景下實測,采用了大象聲科耳機降噪方案的耳機,在通話降噪效果上來看,比 AirPods 2 更勝一籌。
現場,苗健彰為我們演示了三段音頻的對比。第一個是在一個實時噪音環境的 Mic input;第二個是使用 AirPods 后的通話降噪效果,這是目前市面上 TWS 耳機中通話降噪性能表現最好的一款;第三個是使用了大象聲科通話降噪方案的耳機,在實際噪音中的通話效果。通過現場比對,可以看出第三種方案的通話效果更佳。

除了在通話降噪上的效果提升,大象聲科為藍牙耳機提供的 Voice UI 方案也具備了強抗噪特點,喚醒平均率為 95% 以上,功耗低,支持喚醒詞和命令詞定制。這些,都為藍牙耳機廠商提供了更有市場競爭力的產品方案。
AI 智能通話降噪方案
Mems 麥克風的發明,引領了從 2G、3G、4G 語音質量的提升。到了 5G 時代,大象聲科接過接力棒,希望在這個時代通過算法的創新,進一步改變人們在通話過程當中語音質量的體驗。
通話降噪離不開語音信號處理技術,它是計算機智能接口與人機交互的重要手段之一。語音信號處理技術覆蓋的范圍很廣,主要可以分為三個領域或三個步驟:
1. 語音增強分離,把帶有噪音的信號增強分離;
2. 自動語音識別,并實現語音到文字的轉化;
3. 語音合成,對轉化的文字理解之后,進行語音合成,通過語音合成技術,讓機器開口說出來。
自動語音識別和語音合成都已經采用或部分采用深度學習的方法,但是前面的語音增強,還主要是采用傳統的語音信號處理方法,深度學習技術的采用還相對早期。
大象聲科率先將深度學習和計算聽覺場景分析理論結合在一起,通過深度學習技術,將很多需要針對場景進行定制優化的工程化工作,轉化成數據的工作。同時,對于傳統信號處理需要花大量時間編寫人工規則的算法,通過數據自動學習的方式實現對這樣一套信號規則的判斷,從而大大簡化了產品應用落地的周期。

通過深度學習商用落地語音信號處理,大象聲科的 AI 智能通話降噪方案已經成功在手機通訊領域大規模落地,目前小米、 OPPO、vivo、ZTE、黑鯊、努比亞等國內知名手機廠家的多款機型,都已經采用這個方案,為用戶帶來了更加清晰的通話效果。
同時,大象聲科還將深度學習引入回聲消除、波束形成、聲源定位等算法,突破了傳統信號處理方法的性能瓶頸,讓機器真正實現智能拾音。

大音希聲,大象無形。大象聲科希望能夠打造機器聽覺技術平臺,利用深度學習技術,讓機器擁有類似人耳一樣的聽覺能力。從智能手機 ,到藍牙耳機,再到 IoT,不斷擴寬產品應用領域,賦能多個行業,讓人與人更高效溝通,讓機器更懂你我。