發(fā)布融合 VUI+GUI 的全新智能決策引擎 MorUI2.0,驀然認(rèn)知的雙腿正從家居邁向車載場景

五問要做語音版的 iOS 的驀然認(rèn)知,如何打造語音交互應(yīng)用閉環(huán)
打通車與家之間的空間壁壘,實(shí)現(xiàn)語音交互應(yīng)用閉環(huán)。
11 月初,驀然認(rèn)知上線了一項全新的服務(wù)——基于語音交互的電視版網(wǎng)易嚴(yán)選。在此基礎(chǔ)上,用戶可以直接使用語音在電視上購買生活、家居、服裝等一系列用品。
實(shí)際上,「語音版嚴(yán)選」只是驀然認(rèn)知的語音智能應(yīng)用生態(tài)中的冰山一角。目前,驀然認(rèn)知已接入了 40+ 服務(wù),覆蓋了內(nèi)容、O2O、LBS 服務(wù)、電商及其他等 5 大類應(yīng)用,從我們熟悉的查詢天氣、新聞,到叫外賣、買衣服、買電影票,再到加油、停車等等日常事項,都可以直接通過語音來完成。
用驀然認(rèn)知創(chuàng)始人 & CEO 戴帥湘的話來說,驀然認(rèn)知做的是將人們吃穿住行娛樂整個生態(tài)服務(wù)打通的連貫場景服務(wù),為用戶提供全語音對話的智能化服務(wù)。
對此,我們與戴帥湘聊了聊驀然認(rèn)知對于語音交互中的應(yīng)用、場景等方面的思考,以及如何打造語音交互應(yīng)用閉環(huán)。
一問系統(tǒng):打造語音版的 iOS
在多個公開場合中,戴帥湘表示,驀然認(rèn)知想要打造的是,智能語音界中的 iOS。成立之初,驀然認(rèn)知創(chuàng)始人戴帥湘就提出了 DAAA(對話即應(yīng)用)這一概念,即通過語音對話來分發(fā)服務(wù),而 MorUI 就是這一分發(fā)機(jī)制中的引擎的入口。
為什么是 iOS,為什么不能是 Android?
面對這個問題,戴帥湘為我們列舉了 iOS 系統(tǒng)的幾大特征:統(tǒng)一的應(yīng)用形態(tài)、統(tǒng)一的賬號體系,以及多設(shè)備間相互協(xié)作。在戴帥湘看來,這幾大特征正是保證 iOS 良好的用戶體驗(yàn)的基石。
而在語音交互中,要確保用戶有良好的用戶體驗(yàn),同樣也需要這幾大特征——圍繞用戶不同時間段的需求,通過一個通用的超級賬號,將移動互聯(lián)網(wǎng)上的服務(wù)生態(tài)遷移到了客廳、汽車等多個場景中,為用戶構(gòu)建全新 AI 服務(wù)生態(tài)。

正如蘋果通過一個 Apple ID 將不同終端上的應(yīng)用和服務(wù)打通一樣,驀然認(rèn)知也打造了一個基于手機(jī)號碼的賬號體系,通過一個統(tǒng)一的賬號,用戶可以多個設(shè)備(如電視、汽車等)上登陸使用。如此一來,用戶既不需要再面對「記不住賬號密碼」的困難,設(shè)備與設(shè)備之間隔閡也得以打通,用戶在不同終端上的應(yīng)用和任務(wù)都可以實(shí)現(xiàn)無縫遷移,實(shí)現(xiàn)跨終端的任務(wù)操作。
二問場景:打破家與車的空間壁壘
以語音交互最高頻使用的兩大場景——家居和汽車為例,以往大家在談「車家互聯(lián)」時,更多的關(guān)注點(diǎn)都在于如何打破家與車的空間壁壘,實(shí)現(xiàn)在不同空間場景下的設(shè)備控制,比如讓用戶在車上控制家里的智能硬件、在家中對汽車進(jìn)行控制實(shí)時監(jiān)測。
隨著驀然認(rèn)知統(tǒng)一的賬號體系的正式落地,「車家互聯(lián)」除了可以打破這一空間壁壘,同時也把用戶個人的應(yīng)用和任務(wù)在各個空間場景做了一次無縫銜接。舉個例子,當(dāng)用戶在家中的電視上購買了一張電影票,但因?yàn)闀r間來不及需要馬上出門,用戶可以直接離開并在手機(jī)上繼續(xù)完成支付流程;而到了車上,系統(tǒng)可以自動將電影院的地址在車機(jī)屏幕上顯示出來,并主動詢問是否要導(dǎo)航去該地;而在前往目的地的過程中,系統(tǒng)可以為用戶推薦目的地附近的停車場等。

值得一提的是,針對目前客廳等場景可能存在一個賬號可能對多個用戶的情況,驀然認(rèn)知在手機(jī)賬號認(rèn)證的基礎(chǔ)上,增加了聲紋識別認(rèn)證,在需要查詢賬戶信息、購物車或者支付等私密信息時,用戶需要通過聲紋識別或手機(jī) APP 方可查看。此外,采訪中,戴帥湘還透露,未來,驀然認(rèn)知還可能根據(jù)不同場景的需求,引入指紋、Face ID 等認(rèn)證體系,來保障用戶的賬戶安全。
同時,基于這一賬號,驀然認(rèn)知對于用戶畫像的精度也進(jìn)一步得到了提高,并深化了 AI 對用戶的理解,為服務(wù)的「個性化推薦、千人千面」的決策智能化保駕護(hù)航。
三問技能:打通技能與設(shè)備、技能與技能的融合
目前,不管是國外的 Alexa 還是國內(nèi)的語音平臺,大家都在做語音技能開放平臺,吸引各種開發(fā)者來提高自己平臺的技能數(shù)量和種類。然而,在驀然認(rèn)知對語音技能數(shù)量并沒有那么在意,戴帥湘認(rèn)為,技能與設(shè)備的融合、技能與技能之間的融合可以給用戶帶來更好的體驗(yàn)。

在技能與設(shè)備融合上,戴帥湘認(rèn)為,同一個技能往往需要應(yīng)用在不同的終端上,比如有用超大屏的電視、支持觸控的車機(jī)等,那么在開發(fā)中就需要考慮盡可能的兼顧到不同設(shè)備之間的兼容和配適問題,讓應(yīng)用在顯示和操作方式都保持一致,降低用戶在跨終端使用時的門檻,最大程度保證用戶體驗(yàn)。
另一層面上,通過第三方打造的語音技能,技能與技能之間是相互隔離的,不能相互跳轉(zhuǎn)。戴帥湘舉了一個例子,Alexa 平臺上有兩個語音技能,一個是找餐館,一個是訂位置,理論上這兩個技能是可以相互融合的,但因?yàn)榧寄軄碜圆煌拈_發(fā)者,用戶在找到餐館之后,需要先退出這個技能,在進(jìn)入定位置的技能進(jìn)行預(yù)約,在實(shí)際運(yùn)營中,這一體驗(yàn)并不流暢。
因此,驀然認(rèn)知的做法是,把服務(wù)融合到驀然認(rèn)知的系統(tǒng)中,并以一個完整的鏈條提供給用戶,打造更加系統(tǒng)化的服務(wù)。即,用戶在找到餐館后可以直接進(jìn)入預(yù)定位置的服務(wù)中,而當(dāng)預(yù)約時發(fā)現(xiàn)該餐館需要很長的排位時間,可以直接讓系統(tǒng)推薦類似的餐館。
四問技術(shù):輸出全棧式技術(shù),打造技術(shù)閉環(huán)
在系統(tǒng)層面,驀然認(rèn)知表示,驀然認(rèn)知已經(jīng)掌握了語音鏈條上各個環(huán)節(jié),包括:語義理解(NPL)、對話系統(tǒng)、學(xué)習(xí)系統(tǒng)、自動服務(wù)對接、語言生成、語音合成、聲紋識別、喚醒+離線命令詞、遠(yuǎn)場降噪、語音識別等。
基于這一系列技術(shù),驀然認(rèn)知面向 B 端客戶輸出一整套完整的解決方案,并以開放、靈活、定制化的合作方式,為客戶提供一站式、軟硬一體智能語音交互解決方案。

五問商業(yè)模式:聚焦家居和車載
「出于環(huán)境嘈雜和隱私等方面的考慮,國人通常不習(xí)慣在大庭廣眾之下使用語音,家庭和車載這兩個相對私密的場景可作為一個較為折中的切入點(diǎn)。」
這句話來自一年前戴帥湘與深圳灣的對話。彼時,國內(nèi)市場「百箱大戰(zhàn)」如火如荼,BATJM 等互聯(lián)網(wǎng)巨頭爭相入局推出自家的智能音箱。面對火爆的市場,戴帥湘在接受深圳灣的采訪時明確表示,驀然認(rèn)知將主要瞄準(zhǔn)兩類業(yè)務(wù):電視和車載。
一年后,當(dāng)我們重新看回當(dāng)時與戴帥湘的這段對話時,驀然認(rèn)知在家居和車載兩大應(yīng)用場景中均已成功落地。在家居場景,驀然認(rèn)知已經(jīng)與康佳、TCL 等多家知名家電廠商達(dá)成合作,并擁有了不錯的口碑;在汽車場景下,驀然認(rèn)知已與主機(jī)廠達(dá)成合作(但暫不方便對外公布),預(yù)計 2018 年年底可以小批量試產(chǎn)。
而在未來,驀然認(rèn)知想要做的,是構(gòu)建全新的 AI 服務(wù)生態(tài)。基于驀然認(rèn)知的自有全棧式語音 AI 技術(shù),打通車與家之間的空間壁壘,實(shí)現(xiàn)語音交互應(yīng)用閉環(huán)。
one more thing
12 月 4 日,驀然認(rèn)知創(chuàng)始人戴帥湘將出席 WARE 2018 III 智能影音產(chǎn)業(yè)鏈融合峰會,將幫助我們梳理人機(jī)交互變革的過去和未來,分享新交互時代所帶來的應(yīng)用語音化變革,以及驀然認(rèn)知這家 AI 公司,在大屏新交互場景下所探索的應(yīng)用化之路;同時,還將帶我們一起思考,主流交互方式的演變帶來了什么,以及如何應(yīng)對因主流交互方式的演變,而帶來的產(chǎn)品、技術(shù)、以及商業(yè)思維的改變。
報名鏈接:x.shenzhenware.com/2018-3
