蘋果新硬件 HomePod :一款產品,七大謎底,兩大解讀,還是令我們失望了 | WWDC 2017

深度解讀語音技能市場——平臺廠商的下一個必爭之地丨語音智能特稿
這可能是國內第一篇關于語音技能市場的深度文章。
這可能是國內第一篇關于語音技能市場的深度解讀。
1/ 語音智能生態繁榮,缺少不了語音技能市場的繁榮
當我們試圖解讀「語音技能市場」的時候,就如同 9 年前解讀的「應用程序市場」:蘋果 2008 年發布了針對 iPhone 的應用開發包,向開發者開放 App Store;同年,Google 發布了針對 Android 手機的應用市場 Android Market,后來改名為 Google Play,Google Play 是一個由 Google 為 Android 設備開發的在線應用程序商店。
如果非要有一個邏輯清晰的定義,我們這樣來描述「語音技能市場」這一概念:
語音技能是配合語音這一新型人機交互形式而使用的第三方應用。與觸控交互條件下,這些軟件應用集合在軟件操作系統下的應用程序商店,如 Google Play,Apple Store 等。語音技能市場即是在語音交互條件下的第三方應用的集合,目前主要有 Alexa Skills Kit,Action on Google 等主流 SDK 開發平臺下的語音技能應用。
下圖是一個對 PC、手機以及語音交互下的硬件設備、操作系統、語音助手、典型應用、應用程序市場的一個概述表格(主要包含了 Google、亞馬遜、蘋果等在內的大公司):

2/ 語音技能市場的興起,先從亞馬遜 Echo 智能音箱說起
全球語音技能生態發展最成熟的一個市場,當屬亞馬遜的 Alexa Skills。
2015 年,搭載 Alexa 語音助手的 Echo 智能音箱上市。在美國這樣一個基本各家各戶都是「big house」的環境下,憑借智能語音交互的新形式以及出色的遠場語音識別能力,Echo 獲得了市場不錯的反響,并且創下了亞馬遜自家硬件銷量成績的新高(此前是 Kindle)。
起初的 Alexa 并不被亞馬遜列為重點項目,雖然在 2014 年底才被公布,搭載 Alexa 的 Echo 項目早在 2010 年就開始啟動了。看似亞馬遜的「無心插柳」,背后的付出卻遠遠超出了我們的想象。Echo 全球的銷量在2017 年 1 月已超過 700 萬臺,預計今年將突破 1100 萬臺。
正因為 Echo 出人意料的成績,Alexa 在公司內部的戰略地位也得到了提高,團隊擴充到了上千號人,對產品體驗也有著極致要求,例如就為給 Alexa 反應時間降低 2 秒這件事情上,就花去了團隊先后近兩年的時間?;诖罅康挠脩艋A和資源實力,Alexa 的語音識別度也得到大大的提高。
進入 2017 年,亞馬遜對 Alexa 的重視程度越發的高漲,從對接各類智能家居產品(掃地機、智能門鎖、智能燈泡、智能恒溫器等)再到嵌入車載系統、開放 API 接入第三方硬件(手機、機器人、智能手表等)。在今年,亞馬遜更是陸續推出 Echo Look、Echo Show 等新形式硬件產品。

▲ Echo Show 與 Echo
3/ 從 Alexa 到語音技能開放平臺 Alexa Skills Kit
除了硬件的打造和接入,Alexa 還有一項浩大的工程,那就是建設語音技能生態——Alexa Skills Kit(ASK)。Alexa Skills Kit (ASK) 是一個由自服務 API、工具、文件和實例代碼的集合,可輕松構建你自定義的 Alexa Skills,然后發布。就跟那些為 iPhone SDK 或 Mac 開發的應用程序相類似。但不同于手機、平板,這些 Alexa Skills 所對應的服務都由語音交互來完成。
2015 年,Alexa Skills Kit 正式開放,起初的 Alexa Skills 僅有播放音樂、設置鬧鐘、設置提醒、讀電子書、遙控智能燈等功能。到了 2015 年底,Alexa 的技能達到了 135 項。

據說,亞馬遜發布 Alexa Skills Kit 的最初,開發者反饋寥寥,未推動技能市場繁榮,亞馬遜更是拿出了 1 億美元的開發者獎勵計劃,鼓勵開發者為 Alexa 開發技能應用。
2016 年 6 月,在亞馬遜發布 ASK 一周年之際,Alexa 技能數量突破 1000 大關。到了 2016 年底,這個數字漲了 5 倍。2017 年第一季度,Alexa 技能量首次打破了四位數的局面,突破 10000 并成為一個重要的里程碑。

▲ Alexa Skills 發展情況(2015~2017)
Alexa Skills 的不斷豐富增加了 Echo 智能音箱等硬件的使用范圍,除了日常的指令外,Alexa 目前已接入多家商鋪的服務,如汽車、星巴克、披薩店等,另外還有各種娛樂游戲?,F在,用戶登陸 Alexa 賬號進入技能應用網頁,就像當年逛 Apple Store 和 Google Play 應用商店一樣。

▲ Alexa Skills 應用商店
總體來說,Alexa 的技能大致分為兩類,一類是輔助、娛樂類功能,另一類則是商業化應用,而這也是開發者進行商業利潤轉化的一個重要戰地。

另外,在鼓勵豐富內容生態的這件事上,亞馬遜也為 Alexa Skills 應用商店提供了類似 Amazon Underground 這樣的服務,為消費者提供免費 app,開發者則基于用戶使用該應用時長來獲得利潤反饋。
一位資深智能硬件從業者告訴深圳灣,「亞馬遜 Echo 和 Alexa 成功的關鍵,其實更在于較早的語音技能生態的布局。這個階段很像 Android 上線后,從 1 萬個技能發展到 10 萬個技能的階段。Alexa 正處在快速發展的階段,在語音識別、麥克風陣列、降噪、語義理解,均已經實現全站語音交互。目前,Alexa 已有 12000 項技能,并主要致力于做開發者生態。這是其他玩家現階段無法比擬的,或者需要很長一段時間才能追趕上?!?/p>
作為開啟語音技能生態的先行者,Alexa 已有大量的用戶基礎作為鋪墊,再加上 B 端、D 端(開發者端)的打通,搶占語音技能應用市場的優勢已顯而易見。
4/ 在蘋果、微軟等巨頭組團圍剿亞馬遜,后勁最猛的要數 Google Assistant
4.1 最早推語音的蘋果慢了不止半拍
除了 Alexa 之外,蘋果 Siri、微軟 Cortana、Google Assistant 這些由科技巨頭打造的智能語音助理中,Siri 雖最早搭載在硬件上且相對封閉,目前尚未有任何打造語音技能生態的相關消息,而蘋果打造的語音智能音箱 HomePod 已在前不久的 WWDC 上亮相。
深圳灣第一時間對 HomePod 做了深度解讀,結論是蘋果無心競爭亞馬遜。

▲ 蘋果在今年 6 月份的 WWDC 大會上公布搭載 Siri 的語音智能音箱 HomePod
4.2 微軟則搭上了 Alexa 這條順風車
微軟方面,則在今年 5 月份 Build 2017 大會中公布了其與哈曼卡頓共同打造內嵌 Cortana 語音助手的 Invoke 智能音箱。另外,在去年 12 月份,微軟已將 Cortana 開放給家電、汽車、音箱等相關的第三方硬件廠商。
與此同時,在語音技能 Cortana Skills 這項工程上,微軟則采取一個比較省事的辦法——提供 Cortana Skills Kit(CSK)套件,讓開發者能夠將開發的 Alexa Skills 輕松的移植到 Cortana 上,并且這一技術能夠實現完全跨平臺、跨設備操作。
為鼓勵開發者,微軟在今年 3 月份向 Alexa Skills 開發者發送的郵件聲明中表示:「從 Windows10、Android、iOS 和 Xbox 等平臺中統計,目前 Cortana 的月活躍度達到了 1.45 億用戶」,旨在讓開發者樹立起對 Cortana 的信心。
4.3 Google 應該是最上心的了
要在這幾個巨頭中找一個跟 Alexa 步伐離得最近,那就數 Google Assistant 了。在 2016 年的 Google I/O 大會上,由 Google Now 衍生而來的 Google Assistant 被搭載在 Google Home 智能音箱首次亮相。
雖相比亞馬遜同類產品 Echo 面世的時間晚了一年半的時間,Google Home 在進入消費者市場,連接各個智能家居廠商設備上的動作與 Echo 十分的相似。Google Home 搭載的 Google Assistant 也被安插在安卓手機、車載等硬件當中,且節奏把握的十分緊湊。
即便如此,Google Home 還是沒能比下 Echo,根據 eMaketer 最近的預測報告,亞馬遜已經占領了美國智能音箱 70.6% 的市場份額,而 Google Home 僅占下了 23.8%。不過比起那些需要瓜分剩余 5.6% 的小廠商們來說,其處在的地位已相當可觀了。
作為后來者,Google 追趕的步伐則顯得更為緊迫。在一年后的 Google I/O 2017,Google Assistant 迎來眾多功能更新,包括在顯示端中加入文字、圖像溝通等新形式,新增日程創建和提醒功能,開發 iOS 版本 app 上線蘋果 App Store。

▲ Google Assistant 加入文字、圖像等新型溝通方式
同時,Google 還開放 Google Assistant SDK,供硬件廠商、開發者將語音助手部署到其旗下的硬件產品中,如家電、機器人、手表等。這一舉措旨在對標亞馬遜的 AVS(Alexa Voice Service)。
在對標亞馬遜「Alexa Skills kit」這件事上,Google 則加深了 Actions on Google 的應用范圍。對開發者獎賞更是撥了一大筆預算:Google 當時還在 Google I/O 2017 大會上面向全球開發者宣布了 Google Assistant 應用開發挑戰賽 (Actions on Google Developer Challenge) ,其中,一等獎可獲得 2018 年 Google I/O 大會門票、Google 總部參觀機會(包往返旅費)和 1萬美元獎金;二、三等獎也有 7500 美元和 5000 美元獎金加 Google Home 。

早在 2016 年 10 月,谷歌就宣布了 Actions on Google 計劃,讓開發者能夠在 Google Assistant 上創建應用。不過在那時候,開發者只能基于 Google Home 進行應用的開發。
在今年的 Google I/O 開發者大會上,Google 宣布,將 Actions on Google 的應用延展至 Android 和 iOS 平臺。開發者可以通過 Actions on Google 開發自己的人機對話應用,并接入到 Google Assistant 中,并且可以被所有支持 Google Assistant 的設備使用( Google Allo、Google Home、Google Pixel 手機、Android 手機(6.0 以上)、Android Wear、Android Auto、Android TV 和 iOS,另外,通過 Google Assistant SDK 創客們還可以將 Google Assistant 功能帶到自己的自定義設備上,如樹莓派、自動售貨機等。)
與亞馬遜 Alexa Skills 操作方式大不相同的是,用戶在使用 Google Assistant 的 Actions 時,并不需要事先做特別的操作,僅需要發出「OK,Google,Speak/Talk to(Action 名稱)(to do sth)」這樣的指令即可。

而相比之下,Alexa 在 Skills 調動的步驟則顯得更復雜些,用戶需要在手機應用端/網頁端或語音指令來激活這些應用。在用戶體驗這一點上,Google Actions 似乎顯得更有勝算。
巨頭之間的語音技能生態之戰似乎就在亞馬遜和 Google 之間展開,而兩者也各有優勢,一個入局時間早且有相當的積累的,另一個則奮起直追并且有著先前 Google Play 的豐富經驗,雖在技能數上并未占優勢,但后勁卻不容小覷。就目前而言,兩者還是難以相較高下。
5/ 國內語音技能市場發展情況:多是投資人支持下的初創企業在布局,BAT 稍顯平靜
就國內情況而言,「語音識別技術發展的起步較晚,除了 BAT 之外,大部分語音技術公司專注于平臺和產品的打造,產品化尚不夠成熟。從實驗階段的技術,到工程化、產品化,再到開放給第三方合作伙伴、廣大開發者,再到培育開發者和技能市場,Alexa 用了 5 年時間,國內即便是百度 Duer OS 也還有不小的差距。」某行內人士說道。
而對于小型的語音技術創業公司而言,并沒有像大公司那般有豐厚的資源以及經濟實力在語音技術產品化后同時做到將技術開放給第三方、消費大眾,而要像 Alexa 那樣達到上萬個語音技能應用,則意味著更長的時間。
以下是一些布局語音技能應用的國內語音技術公司及其情況:
5.1 硬件產品線布局豐富的出門問問
出門問問的創始人李志飛是 x-Googler,創業后也與 Google 合作緊密:曾獲得 Google Venture 投資,為 Android Wear 提供中文語音搜索服務等。
從成立到現在,出門問問一直沿著「AI + 硬件」這條道路展開產品開發和業務拓展,最近的發布會,出門問問推出了全球首個多場景全覆蓋的及時聯動能力的「問問」虛擬個人助理。
新品「問問」虛擬助理(VPA)已全線覆蓋在出門問問旗下硬件產品,包括問問手表 Ticwatch 、問問耳機 Ticpods、智能車載產品 Ticmirror、Ticeye 以及在今年 4 月份發布與 Echo 同品類的智能家居產品問問音箱 Tichome。另外,問問音箱 Tichome 的海外版本也即將搭載 Google Assistant 操作平臺。

在今年 4 月份的發布會中,出門問問宣布,其 AI 免費開放平臺(ai.chumenwenwen.com)已向硬件廠商、開發者開放,旨在為更多硬件產品「賦能」。
與 Alexa,Google 等走的路子相似,在給自家硬件、第三方硬件「賦能」之后,出門問問的語音技能商店也即將上線,開發者將可基于問問虛擬個人助理創建各種新技能:

5.2 DeepBrain
DeepBrain 是義語智能旗下主打產品,成立于 2017 年初的義語智能,致力于打造國內第一款機器人 SaaS 平臺,對標亞馬遜 Alexa。

目前,DeepBrain 接入廠商移動端用戶超過 2000w,其他 AI 硬件用戶超過 20w,簽約合作廠商包括華為、聯想、三星、驊星玩具、君正、炬力電子、樂鑫等超過 100 家。
另外,目前 DeepBrain 的線上語音技能超過 1000 種,正處在快速增長階段,據 DeepBrain 官方預計,該平臺的技能數將在年底將超過 3000。與國內其他公司相比較而言,DeepBrain 算得上是國內語音技能生態布局的最早且內容最豐富的一個平臺。
5.3 Rokid
Rokid 成立于 2014 年,創始人為阿里背景,公司集結了一波強有力的人工智能技術相關的博士、專家。
2015 年下半年,Rokid 正式推出其打造的第一款桌面機器人產品。
今年 5 月份,時隔兩年,Rokid 推出第二代產品 Rokid.Pebble,具備更親民的價格,目的在于接近消費者。
與此同時,在其舉辦的一次線上「知乎 live」活動中,Rokid 公布了其已建立社區,并在 6 月份向開發者開放 Rokid 的軟、硬件平臺這一消息。從該公司官網可看到,Rokid 已打開供開發者創建技能的入口:

其次,Rokid 表示,該開發項目也將開放給中小企業,與 Google Home,Echo 的布局策略相似,Rokid 目前已與不少物聯網和智能家居企業合作,在 to B 端的市場積極探索。
當 Rokid 的 AI 平臺可以讓開發者實現快速開發,從而提供給 C 端用戶更加豐富的語音技能應用,Rokid 就能在 to B、to C、to D 三維一體中打造屬于 Rokid 的語音技能生態。
5.4 海知智能
成立于 2015 年的海知智能是行業內不多的專注于中文語義理解環節的創業公司。今年 3 月份,海知智能推出了其歷時 3 年打造的 ruyi.ai 平臺,ruyi.ai 是一套自然語言理解和知識圖譜開放技術平臺,可以為智能硬件、智能機器人和企業智能化提供機器人大腦服務。

搭載 ruyi.ai 個性化機器人大腦平臺的有張小盒、墨馨、娃娃親親等為代表的智能機器人產品,以及在今年 3 月份亮相新華社新聞報道現場的機器人實體機器人見習記者 i 思(英文全名:Inspire)、過去曾為網紅的賢二機器僧。
目前,據相關人士透露,海知智能已正在布局類似語音技能開發的開放平臺。
5.5 圖靈機器人
圖靈機器人是以語義技術為核心驅動力的人工智能公司,致力于「讓機器理解世界」,產品服務包括機器人開放平臺、機器人 OS 和場景方案。
2015 年 11 月,圖靈機器人正式發布一款人工智能級機器人操作系統—— Turning OS。Turning OS 是一款機器人專屬操作系統,能夠讓機器人具備和人類一樣的思維能力、情感能力和學習能力,并讓機器人采用擬人的方式與人類進行交流。其與傳統操作系統不同的是,Turning OS 提供多模態交互方式,運行思維強化引擎、情感計算引擎和自學習引擎。

在 2016 年 7 月的首屆圖靈機器人創新大會上,圖靈機器人 CEO 俞志晨發布了 Turing OS 的升級版本 Turing OS 1.5,增加了 11 項機器人視覺能力,在運動控制和硬件模塊實現增強。
據悉,Turning OS 已經有五十多萬企業和開發者用戶。
附:以上各語音技術公司情況一覽表

5.6 國內 BAT
國內大公司體系內,涉及智能語音技術的主要有 BAT,搜狗等互聯網高科技公司。而其中最有可能布局語音技能的就是百度、騰訊。
2015 年 9 月,李彥宏在百度世界大會中正式推出其旗下智能語音助手度秘,并宣布讓這個語音助手「無處不在」的愿景。

在 2017 年 1 月 CES 大會期間,百度推出了人工智能操作系統 DuerOS,并公布首款搭載該系統、由小魚兒科技打造的「小魚在家」。
目前,DuerOS 已經具備 7 大類目 70 多項能力,廣泛支持手機、電視、音箱、汽車、機器人等多種硬件設備,除了能實現語音控制、聊天功能,該系統還直接提供多種 O2O 服務等的智能化轉變。
騰訊方面,在今年 4 月份推出智能語音助手「騰訊叮當」,服務于騰訊生態下的軟、硬件體系,包括旗下各大應用軟件,以及智能手表、耳機、電視以及各類形態的機器人。

緊接著在 5 月份,騰訊云小微正式上線,這是一套騰訊云的智能服務系統,包括小微硬件開放平臺、小微 Skill 開放平臺和小微服務機器人三大平臺。
其中,小微 Skill 開放平臺(https://xiaowei.qcloud.com/index.html)已接入 QQ 音樂、騰訊視頻、物聯等騰訊自有應用,以及天氣、新聞、笑話等服務內容,第三方開發者也能在平臺的基礎上創建自己內容。目前,該平臺正在內測中。接下來,騰訊方也會有進一步的消息。

就目前而言,包括 BAT 在內的大公司或多或少有在醞釀開放語音開發平臺的事情,部分公司尚未有這方面明確的消息。但畢竟對于這些手上掌握大量資源且聚集大量人才的大平臺公司而言,要做語音技能生態并不是難事。
6/ 思考:語音技能生態的喜與憂
盡管不少人認為,語音交互將成為下一代革命性的人機交互形式,語音交互的潛力會不斷被挖掘且成為一種趨勢,但目前這個市場仍還存在一些擔憂和問題。
據了解,亞馬遜 Alexa Skills 平臺上雖然有上萬種技能,但存在同類功能的應用達到上百上千個的情況,甚至有部分技能處于「無人問津」的狀態。在用戶使用率并不高情況下,用戶留存率更是這些應用面臨的難題。

▲ Alexa Skills 各個類型應用占比圖
Skills 對于語音技能系統來說,就像 Android、iOS 系統里的軟件應用一樣,而豐富、實用/有趣的技能是吸引用戶使用該語音系統的重要因素。
在和幾位智能硬件老司機的交談中,我們獲得了一個很重要的觀點:語音技能平臺發展起來的原因并不在平臺本身,而在于有好用的 Skill,而這跟目前的 app 平臺相似。好的 Skill 并不單單只存在某個平臺上。另一方面,平臺的繁榮也依賴于設備端,就如當年的 iPhone 一樣。
其中一家較早布局語音技能開放平臺的公司則表示,他們也曾在開放的路上走過不少彎路,而開放平臺成功的關鍵也不在于做的是否足夠早,也不在于擁有多少開發者,而是如何將技術進行商業化落地。
總的來說,語音技能生態建設任重而道遠,可能遠比 Android、iOS 所經歷的坎坷多。