從算法到芯片,離線語(yǔ)音的花式落地 | 對(duì)話啟英泰倫何云鵬

降價(jià)格,減功耗,提性能,促量產(chǎn),啟英泰倫的語(yǔ)音 AI 芯片如何做到?
離在線語(yǔ)音芯片市場(chǎng)占有率 No.1 的企業(yè),給了我們答案
對(duì)著家里的空調(diào)、電燈、抽油煙機(jī)等家電設(shè)備說話,然后這些設(shè)備真的「開口」回應(yīng)你,并且給你講一堆冷笑話或者新聞和音樂播報(bào)——這盡管有點(diǎn)黑科技,但是大部分時(shí)候還是閑置用不上的無聊科技。
但對(duì)著這些家電設(shè)備發(fā)出「打開、關(guān)上、切換」這類簡(jiǎn)單的語(yǔ)音命令,不需要遙控器,這些設(shè)備就能響應(yīng)你的指令,完成相應(yīng)的動(dòng)作——這種「上手」并不難,并且很快就能成為你習(xí)慣的一種和設(shè)備相處的方式。
這種事對(duì)于家電設(shè)備廠商來說,本來是一件可以提高產(chǎn)品溢價(jià)的好事,但是卻因?yàn)槌杀咎叨茈y大規(guī)模的量產(chǎn)。
- 1 -
成本高,包括這樣幾個(gè)層次:
前期調(diào)研成本高,大抵上要把提供芯片、模組、語(yǔ)音、甚至聲學(xué)的這些解決方案都了解和評(píng)估一遍,而并不是每家設(shè)備商都能配或者愿意配備這些人力。
采購(gòu)成本高,不管是以軟件 SDK 還是硬件模組的方式,拿到手七七八八的和需要集成起來的東西組合,再把成本平攤到單個(gè)設(shè)備里,算下來還是要貴不少,再將這些新增的成本轉(zhuǎn)嫁給消費(fèi)者,進(jìn)而產(chǎn)品的競(jìng)爭(zhēng)力就沒那么大了。
邊際成本高,你把空調(diào)的方案推給我,我就只能上空調(diào)的產(chǎn)線,等我決定了加濕器也想要語(yǔ)音控制的時(shí)候,還得另外采購(gòu)不同的方案,這種分產(chǎn)線小批量的運(yùn)作方式,實(shí)在很難讓我把成本榨到最低。
市場(chǎng)講求一分價(jià)錢一分貨,對(duì)于方案商而言,要降價(jià),卡就卡在性能和成本的平衡上。
把所有我想要的語(yǔ)音控制功能都集成到單芯片里,不需要增加其他的元器件,不要有額外的功耗,不需要設(shè)備一直聯(lián)網(wǎng),還能隨時(shí)調(diào)整甚至增加命令詞,喚醒率和誤喚醒率還要足夠優(yōu)秀,開發(fā)門檻也不要太高,并且,這個(gè)芯片的價(jià)格還要做到足夠低......
這樣的芯片在昨天啟英泰倫的發(fā)布會(huì)上亮相了:
9 月 19 日,啟英泰倫在深圳舉辦主題為「聲無界·芯未來」的新品發(fā)布會(huì),重磅發(fā)布了二代語(yǔ)音 AI 芯片 CI110X 系列(CI1102/CI1103)及啟英泰倫語(yǔ)音 AI 開發(fā)平臺(tái)。二代語(yǔ)音 AI 芯片 CI110X 系列集成了更豐富的功能、擁有更強(qiáng)大的性能、同時(shí)具備更低的成本和功耗。
價(jià)格更低,功耗更低,功能更豐富,集成度更高,簡(jiǎn)直是優(yōu)點(diǎn)一籮筐。也難怪芯片剛一發(fā)布,就已經(jīng)收獲了超過 100 家 Alpha 客戶和超過 100K pcs 的訂單。

- 2 -
在展開對(duì) CI110X 系列的介紹之前,我們先了解一下啟英泰倫這家來自成都的芯片公司,以及他們的一代語(yǔ)音 AI 芯片。
啟英泰倫早在 2015 年就開始入局語(yǔ)音 AI 市場(chǎng),2016 年 9 月推出了全球首款人工智能語(yǔ)音識(shí)別芯片 CI1006,并于 2017 年 1 月實(shí)現(xiàn)量產(chǎn)。這是全球首款 DNN 處理器內(nèi)核人工智能語(yǔ)音芯片,具備高 NN 算力、高識(shí)別率、遠(yuǎn)距識(shí)別、快速響應(yīng)、超低功耗等特性。
雖然靠芯片設(shè)計(jì)起家,但啟英泰倫的創(chuàng)始人何云鵬很早就看清了在設(shè)備端實(shí)現(xiàn)邊緣計(jì)算的趨勢(shì),早在 2015 年就成立公司專門從事基于深度學(xué)習(xí)的語(yǔ)音識(shí)別芯片及配套算法引擎的研發(fā)。
在推出首款支持深度神經(jīng)網(wǎng)絡(luò)的人工智能語(yǔ)音芯片 CI1006 后,啟英泰倫在算法研發(fā)上持續(xù)突破: 2016 年 12 月,本地中文語(yǔ)音訓(xùn)練引擎研發(fā)成功;2017 年 7 月,本地英文語(yǔ)音訓(xùn)練引擎研發(fā)成功;2018 年 5 月,麥克風(fēng)陣列算法研發(fā)成功;2018 年 10 月,聲紋識(shí)別、本地自學(xué)習(xí)研制成功;2019 年 3 月,TTS 上線。
可以說,這些努力,都是希望這顆在端上運(yùn)行的芯片,性能更強(qiáng)大,功能更豐富,擁有更多的離在線智能。
基于這一芯片,啟英泰倫又陸續(xù)推出了一系列的雙麥、單麥方案,以及可以直接量產(chǎn)組裝的模組。而成本也是從最初的 200 元的 AP 方案,一路降到了 35 元,一路助力啟英泰倫在離在線語(yǔ)音產(chǎn)品市場(chǎng),獲得占有率第一的成績(jī)。
- 3 -
我們?cè)賮砜匆幌滦掳l(fā)布的二代芯片。據(jù)何云鵬在發(fā)布會(huì)上的介紹:
CI110X 系列基于 NPU+MCU 架構(gòu)設(shè)計(jì),內(nèi)置升級(jí)了的腦神經(jīng)網(wǎng)絡(luò)處理器 BNPU v2,并新增了語(yǔ)音加速傳感器。CPU 主頻也較上一代的 100 MHz 提升到了 160MHz。
同時(shí),CI110X 系列還內(nèi)置高性能低功耗 Audio Codec 模塊和硬件音頻處理模塊,可以外接麥克風(fēng)實(shí)現(xiàn)單芯片遠(yuǎn)場(chǎng)降噪和回聲消除等功能。同時(shí)該芯片還集成多路 UART、I2C、SPI、PWM、GPIO 等外圍控制接口,可以開發(fā)低成本的單芯片智能語(yǔ)音離線識(shí)別方案。
而通過內(nèi)置的高速 UART 或 SDIO 接口對(duì)接 Wi-Fi、藍(lán)牙等無線模塊,實(shí)現(xiàn)離在線語(yǔ)音方案。基于 CI110X 系列芯片開發(fā)的產(chǎn)品,語(yǔ)音交互的基本功能可通過離線語(yǔ)音實(shí)現(xiàn),而語(yǔ)音內(nèi)容和服務(wù)則可以通過聯(lián)網(wǎng)實(shí)現(xiàn)。

一代 CI1006 芯片具備本地大詞匯量語(yǔ)音識(shí)別、降噪、AEC 的優(yōu)點(diǎn),二代 CI110X 系列芯片則在此基礎(chǔ)上,集成了聲紋識(shí)別、波束形成等更豐富的功能,同時(shí)應(yīng)用了啟英泰倫的新一代本地命令詞自學(xué)習(xí),同時(shí)支持本地和云端的無縫識(shí)別。
CI110X 系列芯片相較于一代在功耗上降低了近 2/3,最低功耗僅需 35mW。價(jià)格上,更是推出了低至 14.99 元的本地語(yǔ)音標(biāo)準(zhǔn)模塊(單筆訂單>500K)。
同時(shí),啟英泰倫也將芯片的應(yīng)用領(lǐng)域,從最初擅長(zhǎng)的家電、家居、照明等領(lǐng)域,擴(kuò)展到音箱、玩具、穿戴設(shè)備、汽車等產(chǎn)品領(lǐng)域,并為開發(fā)者提供易上手的在線開發(fā)平臺(tái),和一整套線上和線下的技術(shù)支持。
憑借著完整的從芯片到算法的軟硬件技術(shù)實(shí)力,啟英泰倫希望用更具性價(jià)比和競(jìng)爭(zhēng)力的芯片和解決方案,助力設(shè)備商快速實(shí)現(xiàn)智能化。
- 4 -
會(huì)后,我們和何云鵬進(jìn)行了深入的溝通,請(qǐng)他幫我們論證「芯片商做算法」行不行以及如何行的問題。
我很早的就意識(shí)到深度學(xué)習(xí)很重要,要把它做到芯片里。
那是在 2015 年以前,阿爾法狗還沒有出現(xiàn),邊緣計(jì)算概念還沒有流行的時(shí)候,何云鵬在某傳統(tǒng)家電公司芯片部門任職。
其實(shí)(我們)是市場(chǎng)倒逼做算法的。
啟英泰倫一開始也希望能與算法公司展開合作,希望他們能開放代碼,再定制封裝到芯片里,但這并不像看起來那樣簡(jiǎn)單,一些客觀因素的限制,讓這種軟硬互補(bǔ)很難深入。啟英泰倫不得不硬著頭皮自己做算法。
算法不是芯片商的優(yōu)勢(shì),但如今算法成為了我們和其他芯片商競(jìng)爭(zhēng)的優(yōu)勢(shì)。我們的芯片性能好穩(wěn)定性高,但是價(jià)格剛開始有點(diǎn)高,這曾經(jīng)是我們的劣勢(shì),但現(xiàn)在我們已經(jīng)攻克了成本的難題,價(jià)格低也成為了我們的優(yōu)勢(shì)。
我們?cè)跁?huì)場(chǎng)里采訪了幾位與會(huì)者,他們有的是啟英泰倫的芯片代理,有的是方案商,也有不少用了他們芯片的設(shè)備商。當(dāng)問及二代芯片怎么樣時(shí),他們對(duì)于性價(jià)比一致點(diǎn)頭,表達(dá)出「很期待」的神情。
我的 70 歲的母親從農(nóng)村搬到城里,不會(huì)用我家里的遙控器。當(dāng)我把家里的設(shè)備都換上啟英泰倫的芯片支持的產(chǎn)品之后,她很容易的就學(xué)會(huì)用語(yǔ)音這樣自然的方式,實(shí)現(xiàn)對(duì)家里設(shè)備的操控,而且,她講的是四川方言。
啟英泰倫有一個(gè)很樸實(shí)的企業(yè)愿景:Make AI Real、Make AI Everywhere、Make AI Simple。用中文翻譯過來就是:讓終端具備真智能、讓智能終端真便宜、讓智能應(yīng)用真簡(jiǎn)單。而如果用四川話來闡釋的話,我想可以大致提煉為:語(yǔ)音 AI 芯片,雄起!
我們希望這一愿景,能夠通過產(chǎn)業(yè)鏈的共同努力,普惠到更多的人。