比阿里早兩年入場的京東叮咚,在國產智能音箱之路上都收獲了什么 | WARE 2017 人物專訪
推出首款聲紋購物 AI 音箱,阿里瞄準的依然是你的錢袋
購物 AI 場景化后,剁手黨該改名叫封口黨了。
站在媒體圈看智能語音界的各路朋友,今天議論的熱點都聚焦在了百度與阿里。兩家巨頭,兩場迥然不同的發布會風格:一個火力全開,一個卻如蜻蜓點水。
今天上午,近 4000 人參與了百度在北京舉辦的 AI 開發者大會,這是百度有史以來規格最高的一次人工智能大會。會上總裁兼 COO 陸奇發表了激情澎湃的演講,公布了有關 DuerOS 語音交互平臺 、Apollo 自動駕駛平臺,以及百度大腦+智能云的幾項重磅進展。講臺上的陸奇讓人印象深刻,多次以「最」字冠名百度的 AI 技術,不斷重申百度在 AI 界的地位。
與百度火力全開的發布會風格相比,阿里巴巴人工智能實驗室在北京時間博物館召開的一個小場發布會,則顯得靜水流深許多。發布會全程交由阿里巴巴人工智能實驗室負責人淺雪(陳麗娟)主持,正式發布了國內首款 AI 購物智能音箱——天貓精靈 X1。
下面深圳灣分三個角度來解讀這場發布會:
一看定位:阿里的首款 AI 消費級音箱,也是國內首款購物音箱,背靠電商,瞄準的依然是你的錢袋

準確來說,亞馬遜 Echo 才是業內首款可購物智能音箱,只是可惜 ,Echo 還不會講中文,國人也不習慣上亞馬遜購物。
而國內最有望率先實現這個功能的,便是京東與阿里。京東旗下的靈隆科技,已經于兩年前布局了智能音箱。如今阿里率先實現了語音購物,對于同是電商的京東來說,實現語音購物功能也不過是個時間問題。
發布會現場 直播測試了天貓精靈的購物功能。根據現場演示,僅需一句喚醒詞,再加上告訴它商品名稱,天貓精靈就能夠自動根據銷量、售價等參數推薦排名靠前的商品;然后經過聲紋識別身份驗證,就可實現支付寶自動扣款,而后續的物流信息也可通過語音查詢。
天貓精靈產品經理釋空介紹說:「由于淘寶商品品類豐富,名詞繁雜,因此技術團隊對所有商品信息進行了標簽化整理,使得天貓精靈在向用戶介紹商品信息時更加口語化。精準的聲紋識別則保證了支付環節的安全性,也方便對商品售后服務的跟蹤查詢。」

當然,作為一款定位于家居環境使用的智能音箱,天貓精靈也集成了生活信息查詢、健身助手、兒童陪伴等智能音箱的標配功能。不過,其中也有兩項便捷功能讓人頗為印象深刻。
第一是家用電器控制。根據釋空的介紹,這款音箱能同時實現終端設備一對一、一對多的家用電器控制,還支持多種場景模式的選擇。例如下班回家,喚醒天貓精靈后會自動切入回家模式,則設置好的必用電器,例如點燈、排風扇、電視、空調等會同步打開,此謂一對多;而如果覺得空調溫度太低,或者燈光太暗,則可語音告訴音箱單獨提升溫度、燈光,此謂一對一。根據王自如現場的演示,利用天貓精靈來點播音頻,或是操控電視點播視頻節目,電器的反應速度也十分快速。
第二,則是尋找手機功能。大家或許都曾有過在上班時卻發現手機不見了的窘迫時刻,而這時告訴天貓精靈尋找手機,它就會自動撥打手機號碼,使用者再根據鈴聲或是亮光尋找手機。有人會想將來這款音箱會不會替代手機進行家人間的多方通信呢,這就得問其背后的阿里通信了。
二看技術:業內首款實現商用的聲紋購物系統,無需 App 也可操作
整場發布會以產品應用為重點,在產品語音技術與硬件設計方面并沒有深入挖掘。不過我們依然能了解到天貓精靈的一些產品技術與設計細節:
天貓精靈 X1 采用了圓柱形的設計,有黑白兩種配色,高 126 mm, 直徑 83 毫米,現場淺雪還專門將其與亞馬遜 Echo 和 蘋果 HomePod 作了對比,以顯示其設計的小巧。
在 X1 頂部中央,配有一枚靜音鍵。當用戶觸發此鍵時,X1 會立刻停止聲音播放,并停止識音功能,以有效保證用戶隱私。

在配置方面,X1 采用了業內首顆 SmartAudio專業處理芯片,相比此前市面上的主流芯片,處理效率提升 25% ,功耗降低 32% 。
X1搭載了 6 麥克風環形陣列,能夠在家庭環境下實現 5 米范圍語音識別。并經過專業音效調節的獨立功放芯片,使得 X1 同時也具有優秀的外放效果。
X1 底部設計了一圈隱藏指示燈,會通過聲音來判斷用戶方位,亮起燈光以示提醒,燈光還會根據不同使用功能和場景配合進行提示。

軟件方面,天貓精靈則采用的是阿里自家團隊研發的 AliGenie 語音交互系統,目前阿里人工智能實驗室正在對聲紋識別、聲紋購 、NLP 中文對話引擎等核心技術申請專利,就在不久前,阿里的 NLP 技術團隊還發表過一篇自然語言處理相關的論文。
既然是要實現語音購物,基于安全性的考慮,聲紋識別功能就顯得十分重要。阿里推出的聲紋購是業內首個實現商用的聲紋購物系統,當用戶發起購物、充值等行為時,只需要說出聲紋密碼,識別系統將會自動進行身份校驗,確認是本人后才會完成交易,否則將拒絕請求。
多輪對話技術方面,阿里技術團隊則在自然語言理解的基礎上,加入了「決策引擎」的機制,使得機器能更好理解上下文語境,并判斷響應的模塊進行決策。
通過深度機器學習,天貓精靈 X1 已兼容 20 個領域的自然語義理解。阿里人工智能實驗室研發的中文語義理解引擎針對常用的定時,提醒,天氣,娛樂內容,家居控制,助手,以及購物等領域進行了特別優化,僅天氣預報就能夠理解 786 種中文問法。
值得一提的是,天貓精靈可以安裝天貓精靈 App 綁定賬號對硬件進行設置,也可以通過「手機淘寶」中「我的設備」中進入操作界面,無需單獨下載 App。

天貓精靈X1售價 499 元,將于 8 月 8 日正式登陸天貓開售。
三看團隊:神秘的阿里人工智能實驗室,可能還憋著很多大招
本以為阿里會借這次發布會,會順便秀一下阿里人工智能實驗室的肌肉,向外界展現其背后積淀的技術實力。遺憾的是,或許是為了避開百度的鋒芒,又或許是未到最佳時機,整場發布會完美的避開了對阿里人工智能實驗室這一角色的深度挖掘。

據了解,阿里巴巴人工智能實驗室去年成立于杭州,辦公地點就在阿里巴巴總部所在地西溪園區,隸屬于阿里平臺技術事業群,直接向 CTO 張劍鋒(花名行癲)匯報。最近阿里另一個人工智能相關的部門 iDST 從亞馬遜 Amazon Go 挖來了首席科學家任小楓打造無人商店,阿里 AI Labs 的初步發力則選擇了智能音箱。不過與名號已經打響的 iDST 不同,在成立后,阿里巴巴人工智能實驗室幾乎未曾在公眾視野中露面。
阿里人工智能實驗室的負責人陳麗娟花名「淺雪」,曾是淘寶網第一代產品經理,歷任一淘網運營總監、阿里智能云總監等職務。另一位重要人物——阿里巴巴人工智能實驗室首席科學家王剛,曾在新加坡南洋理工大學任教,主攻研究方向為計算機視覺中的圖像識別,于今年三月才加入阿里。
這個神秘的實驗室的英文名為 A.I.Labs,復數形式不由得引人猜想,阿里的人工智能實驗室應該不止一個,而是一個集群。阿里人工智能實驗室主要負責阿里旗下消費級 AI 產品的研發,而此次的天貓精靈X1,是該機構發布的首款實體 AI 產品,后續涉及的產品范圍可能會更廣。
四看開放平臺:已接入 100 多個品牌,未來將實現多場景覆蓋
除了音箱,阿里還將開放 AliGenie 開發者平臺給應用開發者、智能家居廠商、硬件生產商等,無需從頭搭建 AI 語音系統,能節省研發上的巨額投入。下面是本次發布會采訪環節關于 AliGenie 開發者平臺的信息:
Q:AliGenie 目前所涵蓋的功能包括?
A:目前有以下功能,隨著更多功能的開發和第三方開發者的加入,功能將不斷擴展
1. 音樂音頻:海量曲庫和內容庫
2. 家居控制:語音控制智能家電設備
3. 購物充值:聲紋實現購物全流程
4. 兒童教育:精選兒童音頻內容,寓教于樂
5. 技能市場:匯聚各種服務和內容,不斷擴展功能
Q:AliGenie 未來還會進入哪些生活及商業場景?
A:目前已經或正在拓展的行業解決方案有
1、 兒童領域
2、 酒店領域
3、 家庭場景下
4、 TO B 其他商業場景
5、 線下零售場景
6、 與其他顯示設備結合的場景
Q:AliGenie 可接入的智能家電范圍包括?
A:目前支持 100 多個品牌,包括接入阿里智能聯盟、涂鴉科技 、broadlink 等智能家居方案的產品,更多智能家電正在接入中。
Q:AliGenie 開發者平臺會開放哪些能力?
A:AliGenie 開發者平臺主要面向四種類型的開發者,包括內容開發者、應用開發者、智能家居開發商和硬件生產商。開發者既可以創建技能,為更多的語音用戶提供服務,也可以將自己的設備接入云端服務,獲取語音交互能力。
依托強大的底層技術、智能的算法引擎、完善的云端服務和成熟的軟硬件標準系統 ,AliGenie 會持續不斷地將全面、易用的核心技術能力進行輸出,為開發者帶去更多可能。通過 AliGenie 開發者平臺,開發者可以鏈接到阿里生態體系中的數億消費者和海量的生活和商業場景。
Q:AliGenie 開發者平臺有哪些核心技術開放?
A: 1、 深度學習
我們研發了國際領先的深度學習技術來作為 AliGenie 的大腦,這些技術成果被發表在頂尖國際會議例如 KDD 和 CVPR 上。我們自主研發的深度學習能快速高效的從海量數據中進行學習,并能在廣泛的應用場景中使用。
2、 自然語言處理
基于我們積累的海量的自然語言數據,和自主研發的國際領先的深度學習技術,我們實現了高效準確穩定的自然語言理解。
3、 搜索/推薦算法
通過阿里積累的用戶畫像,為用戶個性化地提供用戶所需要的信息和內容服務。
4、 知識表示及推理問答系統
我們構建了一個海量的知識庫,實現對萬事萬物的結構化的描述,這個知識庫不僅幫助我們更好的理解語言,更重要的是可以通過推理回答各種知識類問題。
上述能力我們將免費開放給開發者和硬件廠商,無需從頭搭建 AI 語音系統,節省在研發上的巨量投入,使開發者能夠更好的為用戶提供服務。
Q:如何成為 AliGenie 平臺上的開發者?
A:通過我們的開發者平臺,即可申請成為開發者,只需要簡單認證,就可以使用我們的深度學習訓練平臺。
1、 通過官網進行注冊,填寫資料申請邀請碼
2、 一周內發放邀請碼,開放相關工具和平臺
3、 可以利用平臺進行相關的開發和應用,然后提交測試評審,通過后可以在應用商店上線
Q:硬件廠商如何將 AliGenie 集成到自己的產品中?
A:我們會推出全套的硬件參考設計方案,給予合作伙伴足夠的支持。
1、 廠商通過官網申請合作文檔和技術參考文檔。
2、 我們將對申請進行評估,并與合作伙伴討論準備相關硬件的設計方案、接入方案及商業策略。
3、 雙方進行聯合開發和測試,整個過程約 1.5 個月左右完成。
Q:什么樣的智能硬件可以與 AliGenie 連接?硬件廠商如何加入?
A:目前阿里智能聯盟的上千萬智能家居設備已經能夠與天貓精靈X1進行連接。
硬件設備廠商可以通過兩種方式接入 AliGenie:
1.通過 SDK 接入
提供常用平臺(如嵌入式Linux、Android)的 SDK 給到設備廠商 ,SDK 中包含了如長連接通訊、設備用戶綁定、音頻播控、狀態管理等功能模塊,封裝其中的實現細節,開發者可以方便的進行接入。
2.通過協議接入
提供基于 Websocket 的一套標準化協議,由廠商自行進行對接,直接調用 AliGenie 的各項能力。
Q:開發者如何分成?
A:開發者可以獲得全部收益,平臺在推廣期間不參與分成。我們還會推出相關的阿里 AI 創新開發者計劃。
進一步詳細的開放信息將在今年 10 月的阿里云論壇上進一步公開。