售價 2999 元,支持 34 種語言,帶屏幕的訊飛翻譯機 2.0 能繼續(xù)領(lǐng)航翻譯機市場嗎?
篤信語音交互將成為主流,訊飛向 80 萬開發(fā)者展示了升級后的 AI 和 IoT 能力
向現(xiàn)場 2000 位開發(fā)者例行能力秀:老樣子,訊飛各項工作做的都挺好。
很長一段時間,訊飛的盈利問題都遭到業(yè)界的質(zhì)疑。但昨晚,在訊飛開放平臺的「AI·飛無界」新品發(fā)布會上,科大訊飛執(zhí)行總裁胡郁給出了解釋:
訊飛每年在開發(fā)者平臺和核心技術(shù)上的投入是上億級的,2017 年訊飛的技術(shù)投入占總營收比重高達 61.61%,技術(shù)開發(fā)團隊的人數(shù)增長率則高達 56.04%,均大幅度高于 2016 年。
作為一家老牌技術(shù)企業(yè),科大訊飛善于源頭技術(shù)的系統(tǒng)創(chuàng)新,但是在產(chǎn)品和應(yīng)用方面的創(chuàng)新,單靠訊飛自身的力量是做不到的。訊飛在開發(fā)者平臺商不惜代價的投入巨大的財力物力人力,就是希望不斷降低創(chuàng)新門檻,與開發(fā)者共同推動語音交互技術(shù)的應(yīng)用創(chuàng)新。
老樣子,首先回顧 AIUI 的發(fā)展歷程以及取得的成績,這些更新的數(shù)據(jù)了解一下
在還沒有 Echo 和 Alexa 的 2010 年,訊飛發(fā)布了首個中文語音開發(fā)者平臺。2015 年,訊飛發(fā)布了 AIUI,提出了人機交互的新場景和新理念。歷經(jīng)三年發(fā)展,平臺注冊開發(fā)者已經(jīng)達到 80 萬。
科大訊飛消費者事業(yè)群執(zhí)行總裁于繼棟首先對 AIUI 平臺商的開發(fā)者進行了分析,發(fā)現(xiàn)了一些有意思的現(xiàn)象:2017 年,伴隨著 AI 的發(fā)展,平臺開發(fā)者數(shù)量增長了 30 萬;移動終端的開發(fā)者快速增長,而代表了辦公場景的 Windows 開發(fā)者和代表了智能硬件的 Linux 開發(fā)者都獲得了快速增長,此外還有微信小程序的 API 開發(fā)者和 Java 小程序開發(fā)者,這些都是 AI 落地的表現(xiàn)。
過去一年,訊飛也努力的推動著技術(shù)走進人們的生活。從訊飛輸入法的數(shù)據(jù)分析來看,語音輸入作為一個應(yīng)用,活躍度已經(jīng)可以躍進手機 TOP 10 應(yīng)用。用戶每天通過訊飛開放平臺與設(shè)備的交互次數(shù)達到 45 億次,其中智能音箱的日活達到 4000 萬次,車機的語音交互活躍度超過 90%。
而在 AI 硬件設(shè)備商的成績,則包括訊飛 AI 翻譯機 2.0、與中國移動聯(lián)合發(fā)布的咪咕語音助手、與金山居合作推出游戲手辦、阿爾法蛋系列兒童陪伴機器人、與美團合作推出的騎手智能耳機、與美的合作的無葉風扇、與京東合作的支持視覺交互叮咚 PLAY 智能音箱、與紅星美凱龍合作的智能導購機器人、與快思聰合作的智能家居方案,等等。
加大對智能家居場景的滲透,升級后的魔飛 2.0,解決了多設(shè)備同時被喚醒的尷尬
魔飛(MORFEI)是一款成品級的硬件開發(fā)平臺。在去年發(fā)布的雙環(huán)八麥智能麥克風的基礎(chǔ)上,訊飛發(fā)布了升級版的「魔飛 2.0」。超越了固定的硬件形態(tài)的局限,「軟核化」升級后的魔飛可以安裝在各類硬件設(shè)備中。同時,融合了 AIUI 的云函數(shù)能力,使開發(fā)者可以在云端直接編寫業(yè)務(wù)邏輯,實現(xiàn)在一個小時之內(nèi)完成業(yè)務(wù)場景的搭建,進一步壓縮開發(fā)周期。
魔飛的產(chǎn)品經(jīng)理涂康宏特別強調(diào)了魔飛 2.0 的兩點創(chuàng)新:
擁有分布式能力。過去,當用戶對多臺設(shè)備進行喚醒時,命令執(zhí)行會引發(fā)多臺設(shè)備同時被喚醒的尷尬局面;現(xiàn)在,多臺設(shè)備在同一個局域網(wǎng)、同一個賬戶號下,當用戶喊出「魔飛魔飛」喚醒詞時,所有在局域網(wǎng)內(nèi)的設(shè)備進行喚醒分值計算,離用戶最近的那一臺設(shè)備會優(yōu)先響應(yīng)用戶喚醒。
擁有能量跟隨能力。過去,當設(shè)備被喚醒之后,麥克風陣列會根據(jù)聲源的位置指定一個固定的波束方向,除非用戶再次喚醒設(shè)備,否則波束方向不會改變;現(xiàn)在,波束可以根據(jù)用戶的位置和聲源地移動,動態(tài)的調(diào)整播出方向,從而給用戶帶來更自然的交互體驗,也給開發(fā)者帶來更多的想象空間。
此外,魔飛還開放了包括音頻降噪接口、文本轉(zhuǎn)寫接口、合成播報接口在內(nèi)的全鏈路接口,實現(xiàn)了聲紋喚醒能力,開發(fā)者可以通過聲紋接口獲取到用戶的身份信息,并給予用戶個性化推薦。
強調(diào)精品技能開發(fā),升級后的 AIUI 3.0 完善了技能開發(fā)工具和平臺能力
AIUI 3.0 集成了語音喚醒、語音識別、語義理解、語音合成、IoT 等核心技術(shù),優(yōu)化了技能平臺,并整合了硬件、SDK、WebAPI、芯片、小程序等接入平臺,構(gòu)成了一張豐富的系統(tǒng)架構(gòu)全景圖。
訊飛也例行的公布了技能和內(nèi)容平臺的應(yīng)用數(shù)量:120+ 技能和 60+ 內(nèi)容,但更加強調(diào)了打造高活躍的精品技能的重要性。優(yōu)質(zhì)內(nèi)容提供商「工程師爸爸」和「豆果美食」被特別的點名。
為了讓開發(fā)者能夠更加高效的開發(fā)出個性化的技能,訊飛的技能平臺為開發(fā)者提供了自定義問答工具、自定義技能工具,以及云函數(shù)即云端編程的能力、和半監(jiān)督優(yōu)化能力。這個頗有創(chuàng)新性的「半監(jiān)督優(yōu)化能力」,通俗的來講,就是通過系統(tǒng)分析人機交互日志,了解各種熱門說法并推薦給開發(fā)者,并提供多種響應(yīng)方式的建議,從而幫助開發(fā)者更加高效的捕獲用戶需求和優(yōu)化技能體驗。
AIUI 3.0 在不斷的豐富著設(shè)備的接入方式,即便是不智能的嵌入式設(shè)備,只要具有 Wi-Fi 能力,就可以低成本快速的接入 AIUI 的語音能力。
現(xiàn)場,訊飛還舉辦了一場語音技能開發(fā)的挑戰(zhàn),有 4 位開發(fā)者僅用了很短的時間,就完成了一項技能的開發(fā),并通過現(xiàn)場配置好的魔飛麥克風,進行了技能演示和驗證。這里不一一舉例。
發(fā)布智能物聯(lián)云 AIoT,旨在實現(xiàn) 20 億智能硬件的互聯(lián)互通
2018 年,硬件終端規(guī)模已近 20 億,其中,非手機類的智能終端比例,已經(jīng)從 1% 提高到了 7.6%,智能硬件市場正在崛起。過去 18 個月,訊飛已經(jīng)接入了近 1.5 億智能硬件終端設(shè)備,在安防、智能家居、智能辦公、機器人、智能穿戴等領(lǐng)域的合作伙伴數(shù)量都在快速增長。
新發(fā)布的智能物聯(lián)云 AIoT 不僅可以實現(xiàn)訊飛自家設(shè)備互聯(lián)互通,還可以實現(xiàn)自家設(shè)備和其他設(shè)備的互聯(lián)互通,并且還能兼容第三方物聯(lián)網(wǎng)。
智能物聯(lián)云 AIoT 有兩大能力:提供開放、聚合、智能的云服務(wù)平臺;支持設(shè)備在本地的霧計算(邊緣計算)。這些能力被整合到 PaaS 級的開發(fā)平臺里,為開發(fā)者提供 AI 接口和開放設(shè)備連接,讓開發(fā)者可以定制開發(fā),自由創(chuàng)造個性化的智能場景。
現(xiàn)場,訊飛的團隊也為大家展示了設(shè)備互聯(lián)互通和多模態(tài)人機交互的能力。
發(fā)布操作系統(tǒng) iFLYOS,整合技術(shù)和內(nèi)容,免費提供系統(tǒng)級解決方案
最后一項發(fā)布是 iFLYOS,一種更輕量的智能硬件接入方式,一種系統(tǒng)級的語音交互解決方案。
iFLYOS 不僅整合了訊飛語音喚醒、語音識別、語音合成、語義理解這四大基礎(chǔ)技術(shù)能力并免費開放給開發(fā)者,并且,還整合了 1300 萬首咪咕高清音樂、20 萬部訊飛閱讀有聲內(nèi)容、以及 3 萬部院線大片。
為了更好的助力開發(fā)者,iFLYOS 還提供了 API 開放接口、開源了端代碼、并且兼容亞馬遜 AVS 可以讓亞馬遜設(shè)備快速接入訊飛。
篤信基于視覺呈現(xiàn)的語音交互將成為主流交互方式
胡郁的新品發(fā)布后,不僅強調(diào)了科大訊飛在技術(shù)上的策略投入,還和觀眾探討了未來的人機交互方式。
統(tǒng)計表明,90% 信息輸出依靠語音,80% 信息輸入依靠視覺?;谝曈X呈現(xiàn)的語音交互,是否能成為觸摸交互之后,最主要的交互方式?胡郁給出的答案是堅定的。未來,將會有更多的帶有視覺呈現(xiàn)的語音交互場景,如跑步等移動場景下,人們佩戴耳機的無視覺呈現(xiàn)的語音交互;在車載環(huán)境下,對著后視鏡的弱視覺呈現(xiàn)的語音交互;還有在家庭環(huán)境下,在電視、投影等屏幕前的強視覺呈現(xiàn)的語音交互等等。
擁抱軟硬件開發(fā)者的姿態(tài)
自去年 1024 開發(fā)者節(jié)后,訊飛不斷的擴大著開發(fā)者的受眾范圍,并細化著他們的畫像。訊飛將開發(fā)者分為 5 類:能力開發(fā)者、方案開發(fā)者、產(chǎn)品開發(fā)者、技能開發(fā)者、內(nèi)容開發(fā)者,并預測今年將突破 100 萬訊飛開放平臺的注冊開發(fā)者。
在會后的采訪環(huán)節(jié),當深圳灣問起常常出差來深圳的于繼棟,如何描繪深圳的開發(fā)者時,他說,深圳是一個充滿創(chuàng)新的地方。深圳是北京之外開發(fā)者最多的城市,但相比北京的開發(fā)者,深圳的開發(fā)者的兼容性略顯不足。
基于這兩年對語音智能生態(tài)的觀察,我們發(fā)現(xiàn),具有技術(shù)能力的軟硬件開發(fā)者和方案商、終端設(shè)備的開發(fā)者、以及具有軟件開發(fā)和內(nèi)容整合能力的應(yīng)用開發(fā)者,都被或正在被卷入到語音智能這個大生態(tài)。而在各大巨頭和實力派系都在競相搭平臺「秀肌肉」的時候,開發(fā)者的活躍度也超過了以往任何時候。應(yīng)該以怎樣的姿態(tài)擁抱開發(fā)者,則是這些大平臺長遠的課題。(主筆:陳壹零 / 深圳灣;圖源:科大訊飛)