科大訊飛開放平臺產品總監王磊:聲音的力量,語音交互在虛擬現實中的應用

科大訊飛山哥教你玩轉人工智能丨山哥下午茶回顧
不論 2016 年是否為人工智能爆發的元年,今年人工智能領域所取得的巨大成績是不能否認的,同時也讓「人工智能」、「神經網絡」這些原本只存在于故紙堆的學術概念走進了每個尋常百姓家中。
不論 2016 年是否為人工智能爆發的元年,今年人工智能領域所取得的巨大成績是不能否認的,同時也讓「人工智能」、「神經網絡」這些原本只存在于故紙堆的學術概念走進了每個尋常百姓家中。
12 月 23 日,2016 年的末尾,2017 年的前夜,是一個適合總結過去和展望未來的日子,訊飛開放平臺智能硬件業務總監張陳、訊飛開放平臺合作伙伴總監陳其山,以及來自深圳本地狗尾草科技技術總監王昊奮來到「山哥下午茶」活動現場,與在場的開發者探討訊飛開放平臺的發展與未來合作展望。訊飛開放平臺作為全球首個開放的智能交互技術服務平臺,致力于為開發者打造一站式智能人機交互解決方案。
主持人炫姐姐在開場介紹說:「一個月前, 以『 AI+ 』即『 人工智能+創造美好世界』為主題的科大訊飛 2016 年度發布會在北京國家會議中心隆重舉行。本次會議上,科大訊飛推出基于『 訊飛超腦』 的七大新品,包括萬物互聯輸入法、智能車載系統 —— 飛魚助理、中英互譯神器 —— 曉譯翻譯機、智能客服機器人 —— 曉曼、以超腦魔盒為基礎的智能家居系統等 。今天,科大訊飛開放平臺系列技術活動『山哥下午茶』第一次走進『深圳灣』,與在座的各位人工智能、機器人、智慧終端等領域的專業人士,共話語音產業,解答技術疑難。」
信息爆炸的人工智能時代,語音和視覺才是最適的人機交互方式
從 PC 時代到移動時代,信息量不斷增加,而到了未來的智能時代,信息呈爆發性增加,原有的通過鼠標、鍵盤、觸屏的人機交互方式遠不能滿足人們需求。如果說 PC 時代是通過一條「縫隙 」獲取外部信息,移動時代是通過一個「面」來獲得信息,那么智能時代的人類就處在一個全方位被信息包裹的環境中。
張陳認為:「在智能時代,語音、視覺、手勢才是最自然最合適的人機交互方式。」所以,科大訊飛以語音交互為主,未來會結合視覺處理和手勢識別,目前已推出業界首個人工智能交互界面 —— AIUI。「AIUI 集成了遠場降噪、方言識別、全雙工持續對話、多輪對話、上下文修正、自然語音合成等技術」張陳說。
訊飛開放平臺智能硬件業務總監張陳
除了優化人與智能機器的交互,在未來萬物互聯的人工智能時代的背景下,AI 的現實意義是輔助決策,把人們從重復性的勞動中解放出來。在 2014 年,訊飛啟動了一個人工智能項目——訊飛超腦,它是訊飛以語音為切入口、從感知智能到認知智能的人工智能革命的一大推進,目前該項目已經成功運用于教育領域中。
那它是如何工作的呢?張陳說:「我們把考試題庫輸入系統,訊飛超腦通過一段時間的自我學習后,就能解出題目。」另外,張陳表示:「我們的目標是在不久的將來,讓這臺機器考上清華北大。」
訊飛開放平臺的理念是與開發者共同成長
作為中國最大的智能語音技術提供商,科大訊飛推出了全球首個移動互聯網智能交互平臺 —— 訊飛開放平臺。訊飛開放平臺合作伙伴總監陳其山說:「從 10 年開放語音聽寫開始,我們持續開放了語音合成、命令識別、個性化聽寫等服務。15 年,隨著智能硬件行業的興起,我們也陸續開放了面向智能硬件方向的遠場交互方案,如麥克風陣列、用戶級喚醒、AIUI 等服務。訊飛開放平臺秉持著開放共贏的理念,持續為開發者提供最好的服務,目前已經覆蓋 17 萬合作應用和 8.9 億終端。」

訊飛開放平臺的發展歷程
陳其山從技術的角度對訊飛開放平臺的功能接入做了詳細介紹和案例分析,他說,訊飛曾與一款叫做「心聲」的產品合作,這款 App 可以幫助聾人更好地傾聽別人說的話。在與「心聲」合作的過程中,訊飛提供的語音技術將語音轉換為文字,幫助聾人更好地溝通。同時,訊飛還與「心聲」團隊共同探討商業模式,并且推薦參加各種商業競賽,讓「心聲」更好地服務社會。陳其山表示:「訊飛秉持著與開發者共同成長的理念,全維度地服務開發者。」
訊飛開放平臺合作伙伴總監陳其山
那么作為一個開發者,應該如何借力訊飛開放平臺的資源打造產品呢?陳其山表示,開發者至少要搞清楚兩個問題:一是產品的應用場景和人群定位,應對不同的人群和場景,產品就需要有不同的功能。第二,訊飛的技術要解決什么問題,如何通過訊飛的技術解決目標用戶的需求。
琥珀·虛顏 —— 一個虛擬生命的誕生
在今天的「下午茶」活動中,來賓除了訊飛的張陳和陳其山,還有一位是深圳狗尾草科技公司技術總監王昊奮。他認為,對于一個專注產品和應用的公司來說,人工智能的價值就在于創造一個虛擬的生命。所以,結合訊飛的語音技術,狗尾草科技創造出一個叫琥珀·虛顏的虛擬角色。
琥珀·虛顏是一個用全息 3D 顯示器投射出來的二次元少女的動畫形象。按照王昊奮的說法,琥珀·虛顏是 AI + VR 、AI + IP、AI + Game 的結合,它有完整的人物背景故事,本身可 360 度進行投影,同時它可以擁有很多技能,做很多動作,用戶通過裸眼就能看到它生活的方方面面。同時,它是個虛擬的藝人,著名組合羽泉會為它寫歌。總之, 琥珀·虛顏就是在一個硬件里的虛擬少女養成游戲。
狗尾草科技技術總監王昊奮
飛躍時代,語見「AI+硬件」的未來
在「下午茶」間歇,主持人炫姐姐向科大訊飛的兩位來賓提問:「科大訊飛開放平臺的開發者主要分布于哪些領域?與開發者對接合作的過程中碰到過哪些困難?」
針對第一個問題,陳其山總結:「目前,訊飛的語音技術在各個領域都有廣泛的應用,包括教育、醫療、機器人、智能家居等,因為我們是一個平臺,面向全領域。不過,以目前的情況來看,訊飛的語音技術在智能硬件上結合點更多、結合的程度更深,屬于比較典型應用場景。」
對于第二個問題,張陳補充到:「語音技術發展至今,其實有很高的技術門檻,所以有些開發者對語音技術的理解不太深入。第二,訊飛只是提供技術支持,但對于開發者來講,對應用的集成和上下游的整合,就是一個比較大的挑戰。」

茶歇期間,陳其山對開發者進行技術講解
「山哥下午茶」現場展示的訊飛麥克風陣列開發套件
張陳正在向開發者演示訊飛 AIUI 評估板

訊飛工作人員與開發者們探討技術和未來合作的可行性
「山哥下午茶」為與會者提供了豐富的茶點
「山哥下午茶」是科大訊飛開放平臺聯合硬件創業社區深圳灣(shenzhenware)共同打造的語音智能開發者交流活動,聚焦語音技術與人工智能創業,聚集專家、技術達人、創業者,通過技術分享、案例分析等方式,以輕松的下午茶形式促進行業技術交流,共話語音產業,解答技術疑難。
我們堅信,2017 年「AI+硬件」將呈現更加豐富的場景和更加智能的應用,我們也將在 2017 年將更多更優質的技術交流活動呈現給大家。