科大訊飛開放平臺產品總監王磊:聲音的力量,語音交互在虛擬現實中的應用

你的產品植入人工智能了嗎?先從語音交互技術開始做起吧
萬物互聯邁向萬物智能,AI 將會成為物聯網時代的基礎設施,語音技術是基礎設施的核心部件。語音技術的發展是整個物聯網發展過程中最重要的交互方式之一。
谷歌 CEO 在前不久回答投資人的提問時,強調人工智能的重要性,直言已到了引爆點。這些互聯網人整天談 AI,做硬件的人聽著熱鬧、玄乎,落到每一個終端硬件,目前最廣泛的應用還是語音和語義。
萬物互聯邁向萬物智能,AI 將會成為物聯網時代的基礎設施,語音技術是基礎設施的核心部件。
我們先來理解萬物互聯是如何實現萬物智能的。
首先,硬件聯網階段,硬件接入互聯網,獲取云端信息,進行遠程操控,達到互通互聯。接下來,進入硬件智能交互階段,人可以與硬件直接通過語言交流,通過語言獲取各種服務。最后進入硬件智能化階段,硬件具備學習、感知、決策的能力,會了解主人的性格、情緒和習慣,具備云端大腦,具有決策能力,能夠更好的為主人服務。
在這整個實現的階段,AI 技術將作為基礎設施推動整個智能硬件從聯網階段到智能化階段的進程,讓所有「機器」都是成為具備「智慧」的機器人,最終由萬物互聯走進萬物智能時代。
語音技術的發展是整個物聯網發展過程中最重要的交互方式之一。
從技術層面上講,AI 技術主要包括:語音識別、自然語言處理、計算機視覺。AI 成為物聯網時代最重要的基礎設施之一,相關核心技術就是組成基礎設施的核心管網。
在 PC 時代,鍵盤是最重要的交互方式,智能機時代,觸屏是最重要的交互方式,而物聯網(機器人)時代,語言將成為最重要的交互方式之一。這意味著未來整個機器人生態鏈,從上游的芯片、方案到終端產品研發,從系統底層機器人 OS,到上層 UI,應用開發,數據存儲,內容呈現等等從都必須圍繞語音交互這種新的交互方式。
那么由此可見,掌握語音交互核心技術的平臺級公司未來或許會發揮巨大的價值,比如,喚醒、遠距離語音識別、語義理解等。
語音交互技術在一些領域已成為剛需,市場規模呈現爆發式增長態勢。
就目前來說,語音交互技術主要有以下幾條線路。
第一:語音交互技術的應用從下游終端往上游方案商、芯片走,形成軟硬一體化解決方案,出貨量數量級倍增。
第二:從車載、智能家居、玩具等垂直領域場景率先爆發,出貨量達百萬級別,語音交互成為標配。
第三:語義識別需求爆發,與內容和場景緊密結合
語音識別需求爆發后,語義識別(即自然語言理解)需求也隨之爆發。語音識別是將一段音頻變成文本,但這段文本是什么意思,就需要進行語義解析。當智能硬件(機器人)「能聽會說」之后,更重要的是讓其和人一樣學會「理解」和「思考」,而且這種「理解」和「思考」需要與特定領域和場景相結合。
目前語音技術的應用場景和產品還不夠多,當未來億萬家庭中的數十億設備以語音交互作為主流交互方式,這條管道像太平洋那么粗時,萬物智能時代就真正來臨了。

· 亞馬遜出品的 echo 是語音交互終端的領先者
國內哪些語音交互技術的公司值得關注?
暫不考慮 BAT 等巨頭的情況下,國內語音技術產業界將分為三股勢力。
第一股勢力以做語音助手起家的公司:聚熵智能、圖靈(蟲洞)、出門問問
聚熵智能:推出國內第一個中文 siri 產品——智能 360,全球第一個推出 Home AI 智能產品——小智超級音箱,比亞馬遜 Echo 早半年推出。2015 年推出小智管家機器人和 Home AI 云平臺,后者讓智能設備具備從感知與認知的能力。其關鍵能力包含音樂,智能設備互聯互通,生活服務以及機器深度學習等,朝著機器人時代的「Google」方向發展。

· 聚熵智能發布的小智管家機器
圖靈(蟲洞):推出蟲洞語音助手,蟲洞語義云,圖靈機器人等產品,圖靈機器人是一款機器人大腦,可為智能化軟硬件產品提供中文語義分析、自然語言對話、深度問答等人工智能技術服務。
出門問問:中文語音智能交互手表 Ticwatch,以及中文語音交互智能手表操作系統 Ticwear。支持中文語音交互,周邊熱點查詢、語音打車等多樣本地服務,前幾天剛推出針對車載領域推出開車問問。
第二股勢力是以做語音識別起家:訊飛、云知聲、思必馳
訊飛:國內語音巨頭,既做語音技術提供方,也提供軟硬一體化方案,以及開發語音產品(訊飛語點、開心熊寶、叮咚音箱等)。

· 訊飛與京東聯合出品的叮咚智能語音音箱
云知聲與思必馳:兩家也是做語音技術提供方,同時提供軟硬一體化方案(車載、智能家居、機器人領域)。
第三股勢力是以 BAT 巨頭前人工智能負責人創辦企業:地平線機器人、杭州靈伴科技有限公司
地平線機器人:前百度深度學習研究院創始人余凱 2015 年 8 月創立,推出面向自動駕駛的「雨果」平臺,面向智能家居的「安徒生」平臺,號稱要做「機器人時代的英特爾」,使「智能硬件」變「機器人」。
杭州靈伴科技有限公司:前阿里 M 實驗室負責人 Misa 創辦,推出了一款強勁的產品 —— 語音陪伴機器人 rokid,號稱要做「機器人時代的蘋果」。

· 提供家庭解決方案的 Rokid 陪伴機器人
盡管這里并沒有談 BAT 巨頭在 AI 和語音技術的布局,但巨頭的影響無處不在。以上三股勢力,幾乎每一家背后都有巨頭身影。
未來
可以預見,未來的智能硬件,將進化為「機器人」,擁有「大腦」和「智慧」。而作為組成基礎設施核心部件的語音技術,將是智能硬件(機器人)時代最重要的交互方式,并將深刻影響產業變革。
隨之而來的是,語義識別需求的爆發,語義識別的平臺級公司會有巨大的價值。而由于語言文化壁壘,針對中文語義解析,國內公司有著天然優勢。平臺之王,最終落到 BAT 還是新興的創業公司,我們還不能給出定論。但我們期待著新硬件生態的繁榮。
這篇文章很有用