賦能你的手機、你的家、你的車,DuerOS 喚醒萬物的盤子可能比你想象還要大

我們試了試 DuerOS 的手機助手,覺得百度意不在此
在 AI 移動化的初級階段,以手機助手為代表的戰場上,各個玩家目前看起來似乎還勢均力敵,但這場混戰已經明顯開始升級。
11 月 16 日的百度世界大會上,百度 CEO 李彥宏展示了一段用語音控制手機瀏覽新聞的視頻。在這段視頻中,李彥宏一邊吃飯,一邊用手機百度收聽資訊播報,僅靠語音便完成了下一條、查閱百科、返回、調節音量等一系列操作,從頭到尾都沒有觸碰手機。
在這段視頻效果背后提供支持的,是百度 DuerOS 為移動端 App 提供的最新 TTS 解決方案,在 AI 的移動應用方向上,DuerOS 再次加注了籌碼。
在移動硬件端,DuerOS 此前已和 HTC、vivo 等手機品牌達成合作,今年早些時候發布的 HTC U11 以及去年底發布的 vivo X9 都預置 DuerOS 提供的語音智能手機助手服務。

11 月初,HTC 又在臺北發布了最新的「全面屏」手機 U11+,同樣搭載了由 DuerOS 支持的小度助手服務。深圳灣(公眾號 ID:shenzhenware)對手上的一臺 HTC U11+ 進行了簡單的測試,看看其上搭載的小度助手表現如何。
深度集成,隨時喚醒的手機助手
與 U11+ 上的其他「預置應用」不同,小度助手的服務是被直接集成于 ChinaSense 系統中的,用戶可以直接長按 Home 鍵來喚醒小度助手,也可以使用 U11+ 的 Edge Sense 功能,通過按壓邊框來喚醒。此外,在開啟并設置了語音喚醒功能之后,可以在絕大多數界面(包括息屏)通過「小度小度」喚醒詞來喚出小度助手。

一段簡單的測試
小度助手提供的功能包括撥打電話、設置鬧鐘、發送短信、查詢天氣、手機設置、打開應用、地圖導航、附近美食、百科問答等等。
前面的幾項對手機助手來說都是入門級標配,小度助手的表現也十分出色。我們重點嘗試了附近美食和百科問答兩項功能。
餐廳推薦
此前,附近美食推薦的功能曾被多次被當做范例來展示 DuerOS 多輪對話能力,在這個場景下,DuerOS 能夠基于用戶的多輪命令,從多個維度多種標簽來為用戶層層篩選適合的餐廳。



可以看到,篩選維度和標簽非常多樣,小度助手會在一輪輪對話中繼承上輪對話的篩選條件,最終幫助用戶挑選到最適合的餐廳。
由于手機麥克風硬件的限制,Edge+ 上的小度助手不支持語音打斷,在測試中我們使用了 Edge Sense 打斷小度提出新的命令,同時,Edge+ 上的小度助手對吐字清晰度要求還是比較高的,如果吐字不清沒能準確識別,會導致小度將用戶的話理解為其他意圖,進而跳出之前的多輪對話邏輯。
百科問答
百科問答也同樣是 DuerOS 的強項,但體驗流暢的百科問答功能不僅僅是呈現搜索結果這么簡單,除了需要依托豐富的知識圖譜體系之外,還需要強大的自然語言理解能力,正確理解用戶以各種方式提出的問題,并準確給出答案。



對于被百度知識圖譜覆蓋到的提問,小度助手能很快給出明確而精準的答案;其他結構規整的問題,能給出較為明確、足以解答問題的檢索內容;而對一些形式更為隨意的問題,小度多數時候也能給出相關性較高的回復。
AI 手機助手需要好的操控體驗和豐富的內容服務
平臺化、場景化是百度的 AI 落地戰略重要路線,DuerOS 是百度在智能語音領域構建的平臺體系,在智能語音場景下,DuerOS 還要繼續落地到更細化的場景中,像智能家居、智能車載、影音娛樂等等,其中移動應用也是典型的高頻場景之一。

「AI 手機助手」類產品就是智能語音在移動場景發力的「初級形態」。對手機助手來說,我們需要它穩定可靠,操控體驗好,內容和服務豐富,能做夠多。
在操控體驗上,一款好的手機助手要能在需要的時候真正解放雙手,用語音控制手機,小度助手現在已經能夠開啟應用,進行部分手機設置,更進一步的,是像李彥宏所展示的,實現選擇、后退或者翻動等等一系列基本操作,這就需要與手機系統更深層次的集成。目前,DuerOS 已經針對 App 提供的 TTS 解決方案,首先在 App 層面上實現這樣的操控效果。
而手機助手要足夠有用,就需要足夠多的內容和服務支撐,Siri 在國內曾一度被詬病不接地氣,正是因為能配套使用的內容和服務太過匱乏,DuerOS 在內容和服務的落地化程度方面就有優勢得多。
憑借自有的大量資源以及外部接入合作商,百度在 DuerOS 背后構建起了一套相對完善的內容和服務支持體系,同時將這些服務資源與用戶 LBS 信息緊密結合,讓用戶在使用小度助手時能夠更加直接地獲取到需要的內容和服務,不至于處處碰壁。

AI 手機助手僅僅只是開始
之所以說「AI 語音助手」是「初級形態」,是因為這類應用畢竟還是輔助人們更好使用手機的功能,是 AI+語音在移動端可能性的冰山一角。
移動場景之所以重要,除了其高頻的特點,還在于這一場景集中體現了 AI 移動化、個人化和泛用化的趨勢。
在 AI 移動化的初級階段,以手機助手為代表的戰場上,蘋果 Siri、Google Assistant、三星 Bixby、微軟 Cortana、百度小度等玩家目前看起來似乎還勢均力敵,但這場混戰已經明顯開始升級。AI 在移動端的意義將不再僅僅局限于「更智能的手機聲控」,而是各個場景下的 AI 應用,從物聯網、大數據、內容源、終端服務等方方面面向個人化 AI 中樞匯集的過程。
手機在其中仍是不可或缺的屏幕、計算資源和連接口,但將不再是用戶必須每時每刻盯著看的絕對中心,而將成為「AI+語音+屏幕」新交互邏輯的組成部分。那時,就不再是 DuerOS 這樣的語音智能系統去適應手機的交互語言了。
僅依托手機等硬件產品,或單一領域平臺的布局邏輯在 AI 移動化的進程中可能將越發缺乏競爭力,這一階段的游戲,將只屬于少數手握數據、布局完整、廣開門路的玩家。
主筆:陳凱文@深圳灣
攝影:陳宇凡@深圳灣