首款 AIoT 芯片發布 3 個月后開源,這個方案能讓產品智能化的腳步更快嗎 | 十問云知聲

AI 賦能 IoT 設備進入沖量攻堅階段,可定制、體驗好、出貨快的方案仍然稀缺
那么,如何應對 AI + IoT 落地的挑戰?
毋庸置疑,在人機交互系統更迭引發的新一輪產業變革中,語音已成為設備交互的最有效和最自然的方式。以 AI + IoT 為模式的物聯網設備的智能化浪潮,正在加速爆發。
國內語音智能市場在經歷了一年多的大跨越式的發展后,逐漸進入了沖量的攻堅階段。盡管語音大平臺的賦能運動轟轟烈烈,但要把 AI 與現有 IoT 產品有機結合,把用戶體驗的成熟度做到產品級,仍有不小的挑戰。

一方面,對于許多產品團隊和傳統設備廠商來說,技術能力不足,二次開發往往并不順利,導致產品交付無限制的延期;另一方面,對于平臺方來說,面對因為開放而蜂擁而至的長尾客戶,很難有精力逐一做好支持,賦能萬物難免的變成了平臺方和頭部品牌商的秀場。
云知聲聯合創始人康恒博士在 9 月 12 日深圳召開的一場行業交流會上,分析總結了 AI + IoT 落地的 5 大挑戰:
1. AIoT 終端類型廣泛,從產品形態到功能再到使用場景,都呈現了明顯的碎片化的特征,通用方案很難做到全品類的適配。
2. AIoT 終端設備的供應商分散,除了芯片和硬件平臺之外,AI 算法、運算服務、甚至應用程序,都需要多加供應商支持,這無疑加重了終端廠家的時間和財力成本。
3. 不可控的產品體驗。「攢」出來的產品,易造成不可控的用戶體驗。
4. 產品體驗的反復調優,造成 TTM(產品上市周期)無法保證。
5. 方案不能在不同產品之間實現快速復制,造成成本高居不下。

在智能音箱和智能家居這個賽道上,可定制、體驗好、出貨快的語音 AI 方案,仍然是稀缺資源。
面對行業的難題,云知聲推出了基于其首款 AIoT 芯片雨燕 SoC 的開源方案,以開放共贏的心態邀請設備商、方案商和開發者,共同推動智能音箱智能家居產品快速智能化。
為什么要推開源方案?源代碼開放會到什么程度?語音引擎原廠的 SDK 是不是就足夠了?開源方案適用于哪些行業用戶?價格和競爭力如何?針對這些問題,深圳灣在前不久采訪了云知聲另一位聯合創始人李霄寒,大家可以從這篇「十問」中獲得答案。
這里將著重講解,這一開源方案如何能夠解決設備商、方案商和開發者在智能化道路上面對的問題。

首先從芯片談起,鮑晴峰介紹了雨燕 AIoT 芯片架構的特點:
異構 SoC:同時包含通用 CPU (ARM)、 AI 加速器(DeepNet)以及數字信號處理器(DSP)
面向語音 AI 場景,提供 Audio IO,支持 6 個模擬/數字麥克風接入
擁有自主知識產權的 NPU (神經網絡處理器) DeepNet
擁有自主知識產權的高性能數字信號處理器 uDSP
采用基于 ARM 的通用 CPU,便于第三方應用開發
提供豐富的外圍接口:USB、SPI、I2S、SDIO、UART、GPIO等
相對于面向統一應用場景的通用 CPU,雨燕在 DSP 任務加速、miniNLP 任務加速、TTS 任務加速、內存帶寬利用效率、NN 任務提升等核心指標,都能有成倍數的提升。雨燕也被定義為是面向物聯網 AI 的入口級解決方案。

在硬件設計上,通過雨燕以及對應的硬件參考設計,去除了降噪模組和外部 ADC,降低整體成本和研發選型周期。
在系統層面,雨燕的開源方案基于嵌入式 Linux 建構系統,內存占用小于 64M。關鍵器件(DDR & Flash & WIFI)提供至少 2 家供應商的驅動支持,以保證兼容性。Wi-Fi 和 BT 具有不同播放協議(A2dp)和聯網方式(softAP, smartconfig)的支持,并對各種外部設備做兼容支持。
作為第三方語音平臺,雨燕開源方案的云端服務,在可定制、可擴展性方面表現突出,支持多達 40 個領域的語義理解,支持客戶自定義的賬號系統和消息中心,支持云端快速定制 FAQ,支持第三方 skill 接入和第三方內容的整合。
同時,雨燕開源方案提供聲學結構參考設計,為產品提供結構設計建議,并派出語音信號工程師和 FAE 團隊一起來調優聲學結構。

總體上,面向客戶、方案商與開發者,云知聲為客戶提供全棧語音交互解決方案,包括完整的語音 AI 應用參考方案、云端能力以及客制化工具。同時在靈活度方面,云知聲提供了多種開源合作模式,以幫助客戶在跨形態的物聯網硬件產品上的差異化需求。
作為 AI 云服務商、AI 軟件方案商、AI 芯片原廠,云知聲希望用易用的 API、SDK 等開發組件,助力物聯網設備商快速、高效地實現產品智能化升級。