我們體驗了微軟的全雙工語音技術,在多輪連續對話方面小冰表現不一般

與 Alexa 聯姻、主打辦公場景,微軟在語音競爭中有了新思路 | Build 2018
從領先到落后,微軟似乎想通了些什么。
一直以來,微軟 Cortana 都是被拿出來分別與亞馬遜、蘋果、Google 這幾家旗下 AI 語音助手作比較的對象。至于對比結果,微軟也總不出意料的是排名靠后的那一個。
在 2018 年度微軟開發者大會 Microsoft Build 舉辦的首日,微軟宣布拆分其 Windows 業務、全面的進軍 AI 和物聯網的消息。而作為 AI 戰略的重要技術支撐,語音 AI 也成為此次 Build 大會的一大亮點。
Cortana-Alexa 「聯姻」有了最新的動向
早在去年 8 月份,亞馬遜、微軟就公布了雙方旗下的語音人工智能系統將相互打通的消息。在這時隔半年多之后的 Build 大會中,微軟方終于公布了該項目的最新進展。
在該環節中,微軟方還邀請到亞馬遜的一位負責人 Tom Taylor 配合 Demo 演示。
通過對 Echo 音箱說出「打開 Cortana」,微軟負責人 Megan Saunders 喚出了 Cortana,過程就如打開 Alexa 的技能一般。之后,Megan 通過語音指令讓 Cortana 為她讀出了當天的日程安排、發送內容為「I’ll meet you tonight」的郵件給 Tom Taylor。
另一端的 Tom Taylor 則通過與 PC 端的 Cortana 對話調出 Alexa,實現了關燈、用 Alexa 的第三方 Uber 技能叫車等操作。
不過這些 Cortana-Alexa 合作功能都尚未正式開放,Megan Saunders 表示,在此之前,將會事先推出測試版本供小范圍測試和使用。
通過演示和介紹,我們可以了解到,一旦 Cortana 與 Alexa 實現了平臺間的互通,Alexa 用戶便能夠訪問其在微軟系統內相關的生產力信息,包括工作日程、會議安排以及郵件等。而 Cortana 用戶則能跨平臺實現 Alexa 對智能家居設備的控制,以及調動數量多達 4 萬個第三方技能。
目前,不管是從智能設備接入量,還是從技能數來看,亞馬遜 Alexa 都處于行業領先的地位。而對于在這兩方面都不占優勢的 Cortana 來說,擁抱 Alexa 是個能快速(甚至是「一次性」)補充短板的方案。
巧妙避開移動端、家庭場景市場爭奪戰,Cortana 在辦公領域彰顯潛質
作為公司的基礎業務,Windows 系統和辦公軟件 Office 奠定了微軟在辦公領域的頭號地位。如果說 Google 憑借 Android 系統占盡了移動互聯網的紅利,那么能穩坐互聯網 PC 端頭把交椅的就是微軟了。
以搭載 Cortana 的智能音箱為基礎,微軟聯手合作伙伴打造了全新的會議系統解決方案。其中,Cortana 身兼秘書、速記、翻譯等多個職業身份,全方位展示了它「干練」的一面。

在會前,公司職員可通過與 Cortana 對話預訂會議。在多人會議的場景中,配合指向性麥克風陣列、綁定員工電子檔案的視覺系統,Cortana 可實時雙語記錄每位參會成員的對話信息,并基于語義分析做出會議紀要。紀要的內容主要包括「給誰發郵件/打電話」重點事項跟進等。

作為昔日對手,Alexa 一方面與 Cortana 達成了互通合作,另一方面也并沒打算放手辦公生產力領域。
去年底,亞馬遜曾宣布即將推出企業版 Alexa 的消息,緊接著在今年初,Alexa 則以應用程序的形式登陸 Windows 10 系統,部分支持的品牌(華碩、惠普、宏碁)及相應產品也將陸續亮相。
就這一垂直領域,Cortana、Alexa 兩者或將展開一場持久戰。而就目前情況來看,主場作戰的 Cortana 有更大的勝算。
推出 MSDDK 開發板,借助開發者的力量讓語音技術落地更多設備
在設備落地情況方面,亞馬遜、Google 之間的「軍備競賽」大家都有目共睹。前者靠智能音箱成功打開了市場,后者憑借 Android 生態的優勢覆蓋大量的移動端用戶,目前各自都在不斷擴張自己的硬件載體類型,小到燈泡、手表、音箱,大到冰箱、車載。
在這兩年里,Cortana 已逐步從 Windows 中走出來,并應用到冰箱、溫控器等設備上。這次,微軟試圖將語音 AI 能力釋放出來,依靠廣大開發者的力量,讓技術落到實處。
本次 Build,微軟 CEO 納德拉正式發布了微軟語音團隊聯合 ROOBO 共同研發的多 MIC 語音開發板 MSDDK(Microsoft Speech Device SDK),面向遠場語音識別的軟硬一體方案。這是微軟至今在 AI 領域提供的第一個開發者硬件平臺。

開發板使用高通 SOC 平臺,面向不同的應用場景分為圓型 6+1MIC 和線性 4MIC 兩種陣列形式。同時,配合 Azure 提供的認知服務,MSDDK 支持多種語言和知識技能,可以廣泛應用于智慧家電,機器人,智能音響,機頂盒等多種場景。
目前,開發板已經在微軟開發者平臺開放預訂,預計 7 月下旬正式全球發貨。
小結
在誕生時間上,Cortana 比 Alexa 早兩年。但戰略上的差異導致兩者后續發展差距拉大。
在這比 Alexa 早出的兩年時間里,微軟除了不斷優化 Cortana 的功能之外,Cortana 還只停留在 Windows PC 和 Windows Phone 平臺上。
直到 Alexa 用智能音箱重塑了人們對語音 AI 的認知之后,微軟 Cortana 先后登陸手機端(iOS、Android 應用程序)、音箱、車載等。有幾分跟蘋果、Google、亞馬遜在相同領域內進行分庭抗禮的味道。
而在這次 Build 大會中,我們看到了微軟在語音賽道競爭中「智慧」的一面。一是通過合作的形式,將需要花費大量時間的語音生態建設工作放下;二是從自身擅長的辦公領域出發,結合垂直場景對語音技術進行了深度打磨。
而對于微軟自身而言,隨著戰略重心向云和 AI 的轉移,語音 AI 的布局也將逐步走上「正軌」。