不怕寒冬,主打便攜智能的 Rokid 家族新成員 Rokid.Pebble 有望走向大眾 | CES 2017

在這場(chǎng) 5000 多人參與的線上人工智能研討會(huì)背后,更多的是 Rokid 對(duì)市場(chǎng)戰(zhàn)略的思考
Rokid 期待能擁有屬于自己的一片領(lǐng)地,也正在努力著。
去年 9 月份,人工智能初創(chuàng)企業(yè) Rokid 宣布完成 6500 萬美元的 B 輪融資,一躍成為市值 4.5 億的公司。緊接著,在今年年初,Rokid 被福布斯當(dāng)選為全球 AI 公司里的 Top 50。
近日,這家公司組織了內(nèi)部 5 位分別負(fù)責(zé)工業(yè)設(shè)計(jì)、聲紋識(shí)別技術(shù)、人工智能、深度學(xué)習(xí)等方面的博士、專家在知乎開展了一場(chǎng)線上 live,吸引了超過 5000 人參與,據(jù)說是有史以來由企業(yè)舉辦的 live 里參與人數(shù)最多的一場(chǎng)。可以說,這場(chǎng) live 不僅僅是為了公司、產(chǎn)品的宣傳,還有的就是為公司招攬領(lǐng)域內(nèi)人才。
Rokid 靠什么「討好」消費(fèi)者
從 2014 年成立以來,Rokid 就致力于人工智能的研發(fā),其打造的第一代人工智能產(chǎn)品 Rokid 憑借高透光度曲面外殼、DLP 投影、三星 8 核 CPU 的高性能配置,以及獨(dú)具「?jìng)€(gè)性」的語音助手贏得的了業(yè)界和極客們的關(guān)注。

Rokid 第一代人工智能產(chǎn)品
新產(chǎn)品 Pebble 的外形設(shè)計(jì):繼續(xù)打破傳統(tǒng),將「用戶體驗(yàn)」擺在第一位
相比 Google Home、亞馬遜 Echo 等偏日常化的設(shè)計(jì),Rokid 則顯得激進(jìn)些,并將設(shè)計(jì)作為提升「用戶體驗(yàn)」的一項(xiàng)重點(diǎn)工程。
Rokid 打造的第二代產(chǎn)品——Pebble(月石)再一次打破了人們對(duì)這類產(chǎn)品的想象。Rokid 團(tuán)隊(duì)從單細(xì)胞生物上得到啟發(fā),采用圓形、曲線的設(shè)計(jì),將 Pebble 打造成一個(gè)石頭盆景般的外形,使其能夠與家庭場(chǎng)景融為一體,更符合美觀的要求。

Rokid 打造的第二代產(chǎn)品——Pebble(月石)
而這也意味著他們將要克服更多技術(shù)上的困難,例如在物理上如何避免音頻受到干擾——據(jù)悉,同類的 Google Home,Echo 等之所以做成箱體形狀,正是為了將拾音結(jié)構(gòu)、音箱進(jìn)行一定距離的區(qū)隔(分別在頭尾兩端)。
Rokid 工業(yè)設(shè)計(jì)師姜公略表示,他們從始至終都是將「用戶體驗(yàn)」放在了第一位,包括其他同類產(chǎn)品所沒有電池設(shè)置,使得產(chǎn)品能夠在戶外場(chǎng)景中使用。
通過人機(jī)交互設(shè)計(jì)解決人機(jī)對(duì)話「開口難」的問題
姜公略進(jìn)一步表示,面對(duì)語音對(duì)話機(jī)器人,人們往往會(huì)出現(xiàn)「開口難」的問題,即不知道該如何與機(jī)器溝通。他解釋道,這是由人們不了解機(jī)器人的邊界、缺乏基于人機(jī)對(duì)話的經(jīng)驗(yàn)所造成,這就像我們?cè)诟粋€(gè)嬰兒談話一樣,得了解嬰兒(機(jī)器)能夠?qū)υ挼姆懂牐瑥闹蟹e累和嬰兒(機(jī)器)對(duì)話的能力。
姜公略表示,可通過設(shè)計(jì)改變這一現(xiàn)狀。目前,人機(jī)交互主要包括 GUI(Graphical User Interface,圖形用戶界面)、VUI(Voice User Interface,語音用戶界面)兩種模式。
其中,GUI 具有直觀、高效的特點(diǎn),用戶只需在電腦、手機(jī)等屏幕上獲取信息并直接點(diǎn)選。而 VUI 這種以語音交互進(jìn)行獲取信息的方式則存在「低效」的劣勢(shì),這是因?yàn)椋?b>GUI 與 VUI 存在維度上的差異:GUI 是二維獲取信息的方式,VUI 只是一維,需要用戶從頭到尾聽或講一遍信息,才能執(zhí)行下一步操作。
Rokid 作為一款人機(jī)對(duì)話的產(chǎn)品,自然會(huì)面臨這樣的問題。姜公略解說道,基于大數(shù)據(jù)以及人工智能強(qiáng)大的算法能力,VUI 能夠有很大的提升空間,為用戶過濾大量的選擇,提高輸入、輸出信息的效率。例如,在執(zhí)行「餐廳推薦」任務(wù)時(shí),機(jī)器人能夠先將「日本菜」、「西餐」等選項(xiàng)供用戶選擇,首先篩掉一大部分信息,接著給予更接近用戶意圖的選擇。當(dāng)然,機(jī)器人也可在一開始時(shí)根據(jù)用戶以往習(xí)慣進(jìn)行推薦。
Rokid 就此基于人工智能算法的 VUI 設(shè)計(jì),能夠降低人機(jī)交互的復(fù)雜程度,并提高效率。
Rokid 的打造并非是「將手機(jī)語音助手搬上音箱」這么簡(jiǎn)單
要讓機(jī)器人做到與用戶順暢交流,是人機(jī)語音交互面臨的一大難題。Rokid 的朱磊博士表示,聽到、聽懂、反饋是機(jī)器與人交流的三個(gè)關(guān)鍵。他強(qiáng)調(diào),Rokid 的打造并非是「將手機(jī)語音助手搬上音箱」這么簡(jiǎn)單,它在這三個(gè)環(huán)節(jié)都面臨著重大挑戰(zhàn):
首先,需要解決「聽到」的問題,也就是區(qū)分用戶是不是在跟機(jī)器說話。通常的辦法是使用語音激活詞,一般情況下,許多同類產(chǎn)品包括 Google Home,Echo,微軟 cotana 均采用三音節(jié)詞,目的在于降低誤激活率。為了迎合國(guó)內(nèi)稱呼二字人名的習(xí)慣,Rokid 最終選取了 Rokid(中文喚醒詞為「若琪」)這一二音節(jié)喚醒詞,克服大量技術(shù)難題,并前后花費(fèi)了一年多的時(shí)間才得以完成。
其次,要讓機(jī)器「聽清楚」用戶的聲音,也就是遠(yuǎn)場(chǎng)拾音的技術(shù)難題,包括麥克風(fēng)陣列下的波束、降噪、多麥克 VAD 等問題。朱博士表示,基于前人大量的基礎(chǔ)工作,使得這項(xiàng)技術(shù)能夠得到良好的解決,對(duì)于他們來說并非是大的難題。
最后就是解決回聲消除方面的難題。目前技術(shù)能夠處理信噪比大于 0 的情況。而在現(xiàn)實(shí)生活中,信噪比往往在 -30~-60dB 之間,已經(jīng)超出技術(shù)本身的極限。
為此,Rokid 團(tuán)隊(duì)則采用非技術(shù)的手段,包括拾音孔、麥克風(fēng)的方位設(shè)計(jì)、隔音、減震結(jié)構(gòu)等,從技術(shù)、工藝、結(jié)構(gòu)等多方面降低回聲消除的難度。
可見,為了讓產(chǎn)品能夠更貼近用戶、受歡迎,Rokid 團(tuán)隊(duì)將「用戶體驗(yàn)」作為首要的衡量標(biāo)準(zhǔn),在這基礎(chǔ)上穩(wěn)固的打磨人機(jī)交互設(shè)計(jì)以及 AI 技術(shù),堅(jiān)持著他們自身的準(zhǔn)則,并為此花下了不少心思。
Rokid 的潛在問題與「迷茫」
雖然 Rokid 一直以來都堅(jiān)持自己慣有的風(fēng)格,希望將產(chǎn)品做到極致。但與 Google Home、Echo 等同類產(chǎn)品相比,Rokid 昂貴的成本使得產(chǎn)品自身價(jià)格偏高(Rokid 第一代產(chǎn)品價(jià)格在 5000 以上,Echo、Google Home 價(jià)格都不超過千元)。
不難想象的是,這樣的價(jià)格已經(jīng)令不少想嘗鮮的人望而卻步。除了價(jià)格,Rokid 對(duì)設(shè)計(jì)的高度重視已超過產(chǎn)品本身,這從 Rokid 此前借助機(jī)械臂展示產(chǎn)品的宣傳片當(dāng)中也能看出,Rokid 的定位傾向于偏高端消費(fèi)人群,或者更通俗的講,是偏「geek」。

其實(shí),身為一家初創(chuàng)公司,Rokid 這樣做似乎不太妥當(dāng)。知乎上一位關(guān)注 Rokid 的投資者認(rèn)為,Rokid 沒有 Google Home,Echo 那樣的數(shù)據(jù)、電商優(yōu)勢(shì),尤其在后兩者重點(diǎn)為鞏固他們?cè)谒阉鹘纭㈦娚探绲匚欢鴮⒂布鳛檩o助、沖量的產(chǎn)品的情況下,Rokid 走出了靠賣硬件賺錢這樣的一條道路,而這也注定是一條無比艱難的路。
從 Rokid 的布局看它對(duì)未來的思考
不過,在發(fā)展到了一定程度后,Rokid 也意識(shí)到了這一點(diǎn)。
在這場(chǎng)知乎 live 中,Rokid 相關(guān)負(fù)責(zé)人表示,Rokid 即將在 5 月 15 日發(fā)布的 Pebble 以及后續(xù)的新品,價(jià)格都會(huì)很「親民」。這隱約的暗示著,他們希望通過降低價(jià)格的方式,讓產(chǎn)品的觸角伸向更多的消費(fèi)者。同時(shí),Rokid 也正積極尋求各方渠道合作伙伴。
目前,Rokid 已與部分智能家居、物聯(lián)網(wǎng)廠商等產(chǎn)業(yè)上游企業(yè)合作,提供芯片及方案。另外,Rokid 也正在建設(shè)開發(fā)者社區(qū),開放類似亞馬遜 Echo 的軟、硬件平臺(tái)(包括語音識(shí)別、NLP、TTS、拾音模塊等)。未來,Rokid 將會(huì)把這些開放給各中、小企業(yè)。
除了產(chǎn)品、渠道、商業(yè)合作伙伴等方面布局,Rokid 也十分重視底層技術(shù)的積累。在去年,繼北京「Rokid A-Lab」之后,Rokid 緊鑼密鼓的在硅谷部署了「Rokid R-Lab」,持續(xù)大力投入資源和人才在新技術(shù)的研發(fā)當(dāng)中,腳步一刻都沒放慢下來過……
從成立到現(xiàn)在短短兩年多的時(shí)間里,Rokid 從 5 人的「咖啡廳創(chuàng)業(yè)團(tuán)隊(duì)」迅速成長(zhǎng)為一個(gè)橫跨中、美兩國(guó),遍布三地的人工智能研發(fā)中心,一路堅(jiān)持拿到 B 輪投資并成為世界最有價(jià)值的人工智能企業(yè)之一。對(duì)于一家初創(chuàng)公司來說,實(shí)屬不易,也是值得驕傲的資本。
而從這一路以來的變化,特別是商業(yè)模式方面的探索,我們也看到了他們的努力。