首款 AIoT 芯片發(fā)布 3 個月后開源,這個方案能讓產(chǎn)品智能化的腳步更快嗎 | 十問云知聲

AI 賦能 IoT 設(shè)備進入沖量攻堅階段,可定制、體驗好、出貨快的方案仍然稀缺
那么,如何應(yīng)對 AI + IoT 落地的挑戰(zhàn)?
毋庸置疑,在人機交互系統(tǒng)更迭引發(fā)的新一輪產(chǎn)業(yè)變革中,語音已成為設(shè)備交互的最有效和最自然的方式。以 AI + IoT 為模式的物聯(lián)網(wǎng)設(shè)備的智能化浪潮,正在加速爆發(fā)。
國內(nèi)語音智能市場在經(jīng)歷了一年多的大跨越式的發(fā)展后,逐漸進入了沖量的攻堅階段。盡管語音大平臺的賦能運動轟轟烈烈,但要把 AI 與現(xiàn)有 IoT 產(chǎn)品有機結(jié)合,把用戶體驗的成熟度做到產(chǎn)品級,仍有不小的挑戰(zhàn)。

一方面,對于許多產(chǎn)品團隊和傳統(tǒng)設(shè)備廠商來說,技術(shù)能力不足,二次開發(fā)往往并不順利,導(dǎo)致產(chǎn)品交付無限制的延期;另一方面,對于平臺方來說,面對因為開放而蜂擁而至的長尾客戶,很難有精力逐一做好支持,賦能萬物難免的變成了平臺方和頭部品牌商的秀場。
云知聲聯(lián)合創(chuàng)始人康恒博士在 9 月 12 日深圳召開的一場行業(yè)交流會上,分析總結(jié)了 AI + IoT 落地的 5 大挑戰(zhàn):
1. AIoT 終端類型廣泛,從產(chǎn)品形態(tài)到功能再到使用場景,都呈現(xiàn)了明顯的碎片化的特征,通用方案很難做到全品類的適配。
2. AIoT 終端設(shè)備的供應(yīng)商分散,除了芯片和硬件平臺之外,AI 算法、運算服務(wù)、甚至應(yīng)用程序,都需要多加供應(yīng)商支持,這無疑加重了終端廠家的時間和財力成本。
3. 不可控的產(chǎn)品體驗。「攢」出來的產(chǎn)品,易造成不可控的用戶體驗。
4. 產(chǎn)品體驗的反復(fù)調(diào)優(yōu),造成 TTM(產(chǎn)品上市周期)無法保證。
5. 方案不能在不同產(chǎn)品之間實現(xiàn)快速復(fù)制,造成成本高居不下。

在智能音箱和智能家居這個賽道上,可定制、體驗好、出貨快的語音 AI 方案,仍然是稀缺資源。
面對行業(yè)的難題,云知聲推出了基于其首款 AIoT 芯片雨燕 SoC 的開源方案,以開放共贏的心態(tài)邀請設(shè)備商、方案商和開發(fā)者,共同推動智能音箱智能家居產(chǎn)品快速智能化。
為什么要推開源方案?源代碼開放會到什么程度?語音引擎原廠的 SDK 是不是就足夠了?開源方案適用于哪些行業(yè)用戶?價格和競爭力如何?針對這些問題,深圳灣在前不久采訪了云知聲另一位聯(lián)合創(chuàng)始人李霄寒,大家可以從這篇「十問」中獲得答案。
這里將著重講解,這一開源方案如何能夠解決設(shè)備商、方案商和開發(fā)者在智能化道路上面對的問題。

首先從芯片談起,鮑晴峰介紹了雨燕 AIoT 芯片架構(gòu)的特點:
異構(gòu) SoC:同時包含通用 CPU (ARM)、 AI 加速器(DeepNet)以及數(shù)字信號處理器(DSP)
面向語音 AI 場景,提供 Audio IO,支持 6 個模擬/數(shù)字麥克風(fēng)接入
擁有自主知識產(chǎn)權(quán)的 NPU (神經(jīng)網(wǎng)絡(luò)處理器) DeepNet
擁有自主知識產(chǎn)權(quán)的高性能數(shù)字信號處理器 uDSP
采用基于 ARM 的通用 CPU,便于第三方應(yīng)用開發(fā)
提供豐富的外圍接口:USB、SPI、I2S、SDIO、UART、GPIO等
相對于面向統(tǒng)一應(yīng)用場景的通用 CPU,雨燕在 DSP 任務(wù)加速、miniNLP 任務(wù)加速、TTS 任務(wù)加速、內(nèi)存帶寬利用效率、NN 任務(wù)提升等核心指標(biāo),都能有成倍數(shù)的提升。雨燕也被定義為是面向物聯(lián)網(wǎng) AI 的入口級解決方案。

在硬件設(shè)計上,通過雨燕以及對應(yīng)的硬件參考設(shè)計,去除了降噪模組和外部 ADC,降低整體成本和研發(fā)選型周期。
在系統(tǒng)層面,雨燕的開源方案基于嵌入式 Linux 建構(gòu)系統(tǒng),內(nèi)存占用小于 64M。關(guān)鍵器件(DDR & Flash & WIFI)提供至少 2 家供應(yīng)商的驅(qū)動支持,以保證兼容性。Wi-Fi 和 BT 具有不同播放協(xié)議(A2dp)和聯(lián)網(wǎng)方式(softAP, smartconfig)的支持,并對各種外部設(shè)備做兼容支持。
作為第三方語音平臺,雨燕開源方案的云端服務(wù),在可定制、可擴展性方面表現(xiàn)突出,支持多達 40 個領(lǐng)域的語義理解,支持客戶自定義的賬號系統(tǒng)和消息中心,支持云端快速定制 FAQ,支持第三方 skill 接入和第三方內(nèi)容的整合。
同時,雨燕開源方案提供聲學(xué)結(jié)構(gòu)參考設(shè)計,為產(chǎn)品提供結(jié)構(gòu)設(shè)計建議,并派出語音信號工程師和 FAE 團隊一起來調(diào)優(yōu)聲學(xué)結(jié)構(gòu)。

總體上,面向客戶、方案商與開發(fā)者,云知聲為客戶提供全棧語音交互解決方案,包括完整的語音 AI 應(yīng)用參考方案、云端能力以及客制化工具。同時在靈活度方面,云知聲提供了多種開源合作模式,以幫助客戶在跨形態(tài)的物聯(lián)網(wǎng)硬件產(chǎn)品上的差異化需求。
作為 AI 云服務(wù)商、AI 軟件方案商、AI 芯片原廠,云知聲希望用易用的 API、SDK 等開發(fā)組件,助力物聯(lián)網(wǎng)設(shè)備商快速、高效地實現(xiàn)產(chǎn)品智能化升級。