全系標配滿級防水,OPPO A5 系列新品正式發布

圖靈郭家:兒童 AI 玩具自帶人格屬性,AI+IP 是兒童產品的一個大趨勢
圖靈機器人是一家聚焦人工智能語義的 AI 服務平臺,自 2010 年成立至今,已在全球聚集了近 70 萬名注冊開發者,合作伙伴包括三星、微軟、騰訊、百度、聯想、海爾、HTC、小米等大牌廠商。而在不久前更是全面接入小愛同學,開始發力兒童 AI 語音技能。
在本次「深圳灣 WARE 2018 新硬件峰會」上,圖靈機器人聯合創始人郭家發表了他對于 AI 技術應該如何更好的應用于兒童領域的看法。
他認為,AI+IP 已是國際上兒童產品的一個大趨勢,而要實現 AI+IP 的完美融合,首先應該聚焦把技術融合在構建影響力層面,從而實現吸引更多粉絲購買。
那么圖靈如何將 AI 能力變現為智能服務呢?主要分為三個方面:一是在圖靈語料總庫的基礎上,為每個機器人建立一個獨立的記憶系統,讓機器人學習并記憶每個用戶個性化的習慣數據,這樣會就有更深的粘性;二是為優質的合作伙伴定制特有資源的 AI 技能、知識圖譜;三是根據不同 IP 的內容劇本,訓練出每個 IP 獨有的話題。
以下內容為郭家在深圳灣「WARE 2018 新硬件峰會上」的演講實錄,在不改變愿意的基礎上略有刪減:

嘉賓:圖靈機器人聯合創始人 郭家
主題:AI+IP:兒童智能產品的 AI 交互模型
大家好,我是圖靈的郭家。今天跟大家分享一下 AI 在兒童領域的應用探索。
幾天前,艾瑞咨詢發布了一份 AI 領域的分析報告,分別從橫向幾個維度和縱向幾個維度解析了人工智能產業:
橫向維度包括基礎設施(如芯片、傳感器、數據)、行業應用場景(如工業、金融、教育)等,縱向維度則是按照技術歸類劃分,我們最終發現其實每個產品都可歸類于這三大類技術:語音辨識與合成(ASR/TTS)、語義理解(NLP)、機器視覺(CV)等,這也是目前人工智能領域主要的三大主流技術框架。
(圖)
圖靈主要是做智能語義這個細分技術的,我也非常認可曾老師剛才的觀點,一個產品好必須要名字好,「圖靈」是我們比較早注冊的一個名字, 2010 年公司開始探索 AI 方向時就把這個名字注冊下來,當時人工智能領域還沒有今天這么大的熱潮。
我們從開放語義技術到現在,已經在全球積累了 70 多萬開發者,每天還有很多開發者和企業應用我們的語義平臺。自 2015 年開始,我們的兒童領域逐步跟 TOP 10 的企業達成合作,這里面有一些是兒童領域的,有一些是非兒童領域的,我就不一一列舉了。
(圖)
在語音語義交互領域有哪些關鍵的指標和構成呢?這是圖靈的一些關鍵數據(見PPT),左邊是我們最看重的算法類指標,包括語音、語義的交互數據,包括分詞、意圖解析 、NER 準確率等,標黃的部分則是客戶及用戶層面也非常關注的數據。
(圖)
比如說響應速度,我記得在跟富士康合作的過程中,有幸看了一下 Echo 的交互數據,從用戶說話到反饋結果,平均耗時 1.5 秒。我們測了很多國內的產品,有的比它還要更快,這是特別重要的一個指標。還有一個指標,我們問一個問題,機器能不能回答好,包括兩部分:第一部分是正確的理解、聽懂你的意思;第二部分是找到合適的答案給到你。所以意圖理解是非常重要的環節,也是各項國際賽事主要 PK 的指標。
我們常講 AI 的技術的本質是算法+數據,數據的積累往往是一個公司的門檻。我特別認可一句話,所有的互聯網公司都會變成數據公司,所有的數據公司都會變成人工智能公司,所以數據對大家至關重要。圖靈還為兒童提供兒童音視頻資源和成人音視頻資源。
小米 3 月 15 日發布會當天起,我們和小米兒童產品全面合作,在小米智能手表、故事機上面采用了圖靈的 AI 技術。而在 3 月 27 日小米發布會上,雷軍宣布小愛同學不僅植入了電視,還植入了手機,我們圖靈也進入到里面的兒童對話部分。
圖靈的 AI 技術包括三大方面的能力,一個是語音對話,包括閑聊型、知識問答型和技能任務;第二是兒童內容點播;第三是家長端。相信在座的各位比較熟悉,這也不是今天要跟大家討論的重點,重點是另外一部分是 AI+IP 部分。
(圖)
首先看這個數據,白色的這款是 MIT 著名的 Jibo 產品,也是幾個教授一起做的一款產品,它的銷量比起超級飛俠的銷量,以及用戶的喜愛度還是差很遠。其實,對兒童來說,喜歡哪個不喜歡哪個,從外觀和表現力上就已經非常明顯。
這是圖靈的 AI+IP 的模型。首先我們看 IP 的價值是什么:首先要有足夠的流量建立影響力,比如明星,我就要拉著他經常走秀,讓他出名;然后接一些廣告變現,進行粉絲消費變現,在動畫領域的一些兒童 IP 已經有這樣的價值了。
那怎么實現 AI 技術與 IP 的融合呢?首先從技術層面來講,包括語音、視覺、機械控制等,其次還要做很多智能化的服務,才能讓整個 AI 價值體現出來。
(圖)
換一個維度來梳理框架,要把 AI 疊加在 IP 上面,就應該是把技術融合在構建影響力這個層面,去吸引足夠多的粉絲,然后把智能化的服務和消費在上面,這是我們主要思考的 AI+IP 的模型。在這個模型下,我們來看一下都包含哪些東西:
首先,多模態交互。我們給客戶定制的個性化多模態交互包含四大部分的功能:第一,屬性個性化,定義機器人的姓名、年齡、性別、父母等等;第二,音色個性化,用 WaveNet 生成語音 TTS 模型;第三,動作個性化,比如小時候看『圣斗士星矢』,每個角色都有標志性的動作,包括現在的動畫片,標志性動作都非常重要;第四,表情個性化,每個角色交流過程中不僅有動作、聲音,還有豐富的表情,這是通過精準計算后得出的情感程度、情感類型而展現出來的。
給大家展示一下幾種 TTS 的效果。(播放音頻)這是目前市場上主流的 TTS 技術。但是今年一月份發生了一件事情 ,AlphaGo 團隊開放了一個最新的 TTS 技術—— 基于 WaveNet 卷積神經網絡的 Cloud TTS,發布之后我們試了一下,幾乎秒殺 BAT 和訊飛的 TTS 的效果,給大家聽一下最新的效果(播放音頻)。
不難發現 ,Google TTS 的音色的圓潤程度遠遠比市場現有 TTS 音色的圓潤程度高,能做到和人物原聲相似度達 95% 以上。甚至還有一些客戶找到我們,讓我們幫助做電話銷售的 TTS,就是當你接起電話,那邊與你講話的就是合成的聲音 。Google 的技術確實非常好,能夠比我們國內研發迭代的速度更快一些。
清華大學 Aminer 團隊不久前發布了一份報告,報告顯示圖靈兒童 AI 專利數為同類專利總數的 62%,多模態交互專利全球第二 ,AI 專利總數則是全球第四。
(圖)
接下來講一下智能化服務,也就是我們的 AI+ IP 模型怎么變現。分三方面:
第一,建立獨立記憶系統。這個需要海量的數據來做,例如如果能持續記錄用戶的個人習慣,并做出相應的個性化調整,這能使得產品有更深的粘性。
第二,定制語義技能。因為我們一直也是開發者,所以為優質合作伙伴定制自有資源的 AI 技能、知識圖譜等。
第三,劇本式話題,根據動畫片的劇本,生成每個 IP 獨有的話題。比如說我們跟小豬佩奇合作,跟超級飛俠蒙奇小隊(音)合作,我們訓練出來的內容跟其他內容就不一樣。比如我問它,你有去過巴黎嗎?如果小豬佩奇就會說,法國就在我們隔壁,我經常去;如果是超級飛俠就會說,我本來就會飛,想去哪里就去哪里。
響應客戶的需求,我們做了大量兒童類的教育工作,我們把一些課本教材拿過來作為資源。
(圖)
AI+IP 也是國際上兒童產品的趨勢。如圖,圖一是我們圖靈和日本夏普合作的 RoBoHoN 機器人;圖二是會說話的超級蜘蛛俠;圖三是迪斯尼申請的的 AI 劇本專利,就是把故事給兒童 AI 訓練學習,這也是兒童領域的大方向。
作為一個機器人,它所體現出來的玩點,對兒童的吸引點究竟在哪兒呢?我們找了世界各地的小朋友做了一次調研。第一張圖中是墨西哥的一個小朋友,他最喜歡小汽車。第二個是意大利的小朋友,喜歡各種公主裙和芭比娃娃。第三個喜歡飛機。第四個中國小朋友喜歡槍和炮。
小朋友喜歡玩什么?答案很明確,就是給他一個能承載夢想的實體。比如說,第一個是駕駛員的夢想,我小時候玩小汽車就有在駕駛的感覺;第二個是公主夢;第三個是飛行員的夢想;第四個是當戰士的夢想。
我們可以這樣來設想,兒童眼中夢想的機器人應該是什么樣子?他們極具想象力,你給他一個簡單的玩具,他就能設想出一個完美的夢想。例如圖中在我們看來就是一個簡單的帳篷,但在孩子們的眼中它可能是一座城堡。
(圖)
AI 機器人天然自帶一種人格屬性,它就是一個有生命的機器人,而多模態交互能讓 IP 角色更加豐富,這樣就能夠更加滿足他的夢想。同時我們再在其中加入智能化的內容服務,就可以幫助孩子產生對學習的樂趣。
以上就是我的分享,謝謝各位!