角逐智能小家電藍海市場,AI 企業該做怎樣的技術儲備和戰略規劃丨WARE 2019

AI 全面落地,詳解聲智科技全鏈條操作系統 SoundAI Azero | WARE 2019
比起談酷炫的概念,聲智科技更希望腳踏實地地把這些概念一一落地。
小米 AI 智能音箱、小度智能音箱、華為 AI 音箱、王者榮耀智能機器人、榮耀 YOYO 智能音箱、天貓精靈魔盒……
不管你是不是一個智能音箱用戶,上述的產品中,你或多或少都聽說過。而在這些音箱們「小嘴叭叭」與用戶交流的背后,多多少少都離不開一家名為「聲智科技」的公司的支持。
聲智科技是一家融合聲學和人工智能技術的平臺服務商,成立 3 年,聲智科技已經占領中國語音市場超過 70% 的市場份額,是全球最大的智能音箱技術供應商之一。
在過去兩年多的「百箱大戰」的戰場上,各家音箱產品身上,或多或少都有聲智科技這家公司的身影。官方數據顯示,目前,聲智科技賦能的產品累計出貨量超過 2000 萬臺,其服務客戶包含了小米、百度、阿里、華為、騰訊、360、中國移動等多家行業巨頭。
用周治國自己的話來說,聲智科技是一家「躲在巨頭背后的服務提供商」。
7 月 19 日,在由深圳灣舉辦的「WARE 2019·新硬件 AI 技術與應用峰會」上,聲智科技銷售總監周治國與我們分享了在 AI+IoT+5G 的融合新趨勢,聲智科技對于智能語音設備下半場的思考,首次在深圳公開分享全鏈條遠場智能交互系統「SoundAI Azero」,并帶來了 SoundAI Azero 賦能的多款硬件產品。
/ / / / / / / / / /
智能語音市場上的「冰」與「火」
過去幾年中,智能音箱市場有多么火熱,我們可以從數據中明顯感受到——根據 Strategy Analytics 披露的數據,2018 年全年智能音箱的出貨量達到 8620 萬,其中,2018 Q4 單一季度的出貨量便達到了 3850 萬臺,超過 2017 年全年的出貨量。
而當時間進入 2019 年之后,我們再度聚焦智能音箱市場,不難發現,這一市場依然火爆,但市場格局早已不是兩年前的「百箱爭鳴」,現如今的智能音箱市場,玩家僅剩為數不多的幾家巨頭,留給產品團隊和傳統設備廠商的機會并不多。

在復盤這一市場時,周治國指出,與傳統智能硬件相比,語音產品技術鏈條長,需要整合的技術和內容較傳統硬件要復雜得多,受限于團隊的資金和技術能力,要把語音 AI 的用戶體驗成熟度做到產品級并實現量產,期間的挑戰并不小。
智能音箱這么火熱,為什么市面上看到的品牌那么少?國外只有亞馬遜和 Google,國內集中在百度、小米、阿里、騰訊這些巨頭手里。是大家不想做嗎?真的是由于巨頭補貼造成大家對這個市場有一些膽怯嗎?其實不是。
一方面,智能音箱涉及到喚醒算法、降噪算法、聲學結構、內容整合等多項技術,技術鏈條長,只有巨頭廠家才有能力調動資源;另一方面,智能音箱后期需要接入大量的技能、服務、視音頻內容等,這所需時間周期長、成本高。
而隨著 AI+IoT+5G 的到來,智能語音硬件還遠遠不止智能音箱單一品類,需要應對的產品形態更加多樣和碎片,這將大大延長技術鏈條在設備的移植周期和成本。此外,智能語音產品還存在聲學調試困難、開發周期長等問題,這些問題對于產品團隊和傳統設備廠商來說,都是不小的挑戰。

基于上述思考,聲智科技發布了全鏈條遠場智能交互系統「SoundAI Azero」。該系統以遠場語音交互和遠場雙工通話為技術內核,兼容主流芯片架構、硬件設計和聲學結構,具有一站式 Turnkey 解決方案、全面的語音交互能力、高整合內容資源、協議兼容性強、兩周實現快速開發等特點,可廣泛應用于多種場景的硬件設備。
AI+IoT+5G 背景下,行業需要能夠快速落地的一站式解決方案?
SoundAI Azero 與 Alexa 類似,同樣提供了從聲學結構設計、遠場語音交互、技能服務開發的一站式全鏈條解決方案,但其目的又不只是做好「中文版的 Alexa」,而是基于聲智科技在中文語音市場豐富的服務經驗,在各個細節做精、做細,幫助設備廠商又快又好地實現產品開發和量產。
如周治國所說:
SoundAI Azero 操作系統只有一個目的,就是幫助大家的產品快速落地。

語音交互方面,SoundAI Azero 集成了遠場喚醒、波束形成、聲源測向、噪聲抑制、混響消除、回聲消除、端點檢測、語音識別、聲紋識別、語義理解、語音合成、雙工通話、自然語言處理、聲波配網等多項技術,遠場交互能力強,并支持硬件檢測。

同時,SoundAI Azero 還支持自定義喚醒詞。周治國表示,未來,設備商可以在 1~2 天內實現快速自定義喚醒詞,且這一喚醒詞的體驗效果可以達到目前小米「小愛同學」體驗效果的 85%,以實現產品快速上市。而在產品上市之后,廠商還可以通過在線數據收集的方式來實現自定義喚醒詞的迭代升級,讓產品體驗慢慢向「小愛同學」們靠近。
內容和服務方面,SoundAI Azero 接入了市面上主流的音樂、有聲讀物、視頻平臺,以及信息查詢、生活服務、出行路況等服務,并通過免費技能的方式開放給合作伙伴,確保設備從一開始就具備了語音交互基礎的內容和服務。同時,SoundAI Azero 還提供靈活的技能開發及接入方式,支持 Android、 Linux、QNX 等七種系統以及多種播放器,常用技能開發部署時間一周以內,可極大縮短開發周期。

為了幫助合作伙伴完成快速開發,在云端,SoundAI Azero 還支持「內容+IoT+APP」三云合一;設備端,SoundAI Azero 對 Turnkey 代碼進行了開源。基于此,設備上最快可以實現兩周完成快速開發工作。

在應用場景方面,SoundAI Azero 除了我們熟悉的智能音箱外,也將支持智能家居、智能會議、智能教育、智能醫療、智能汽車、金融科技、能源電力、智能法院、智能交通和機器人等多種應用場景下多個終端產品。
Azero 系統不止是針對智能音箱,聲智科技希望將語音引申到各行各業,用一套系統解決所有事情,降低中小客戶在這方面的投入。
對話聲智科技:做好細節,把炫酷的概念真正落到具體的應用中
深圳灣:智能音箱新一輪的較量是產品體驗和技術實?的較量,未來, 聲智科技有哪些可以領先行業一到兩年的技術研發投入?
我們(聲智科技)本來是躲在巨頭背后的服務提供商,我們現在想針對中小企業提供服務。我們(聲智科技)有一個口頭禪,聲智科技是比較實在的公司,我們更關注的是全鏈條用戶的體驗。當然,與很多語音技術提供商一樣,包括聲紋、分布式拾音、多輪對話、全輪對話,這些技術聲智科技都會做,但是我們重點會關注整個鏈條真實的體驗。
舉個例子,整個鏈條的延時,如果通過多個云來做,產品延時會非常長,而超過 1.5 秒以后就會影響用戶實際的體驗,所以,聲智科技希望通過三云合一,大大縮短這個時間。類似這樣的產品體驗提升,是聲智科技的主要方向。
另外,我們要快速加快這些硬件的落地,可能會支持更多操作系統、硬件和操作平臺,包括一些低功耗的,我們不會自己做芯片,但是會支持更多芯片公司、芯片廠家,賦予他們智能硬件的概念。
深圳灣:SoundAI Azero 全鏈條遠場智能交互系統可以幫助客戶兩周內完成快速開發,那么到量產上市一般可以有多快?
「兩周內完成快速開發」是針對語音鏈條的開發,至于整個產品的量產周期需要根據產品的復雜性而定。根據我們的經驗,如果這個產品是無屏的智能音箱,基于 SoundAI Azero ,我們可以將目前市面上主流的 7~8 個月的產品上線時間縮短到 2 個月。