你的產品植入人工智能了嗎?先從語音交互技術開始做起吧

AI 對話技術沒那么簡單,那有多復雜?
AI 對話技術概覽,聽聽 360 搜索技術總監怎么說?
人們每天在 PC 、手機端等進行的簡單搜索行為,其實就是一個人機交互的過程,在搜索框輸入關鍵字,搜索引擎則分析輸入內容的語義,盡可能為用戶推薦高精確度的答復。
曾幾何時,各大搜索引擎都紛紛增加了語音搜索功能,相比書面化的文字搜索,人們在語音搜索場景下的表達往往更口語化,進而增加了搜索引擎的處理難度。在極客公園 2016 起點·創造者峰會 AI 論壇上,360 搜索技術總監魏少俊解析了 AI 對話的技術。
AI 對話的三種類型
從技術層面上,人與 AI 的交互方式分為三種:功能型交互、內容型交互、開放型交互。

功能型交互:也稱為命令型交互,即接到人類的要求、命令后,機器通過語音識別、語音合成等技術解析語義,進一步執行任務。在這種交互方式下,人們所提出的指令只限于簡單易懂的內容。
內容型交互:也稱為知識型交互,如讓機器講一個童話故事,回答既有的地理知識等。基于海量的知識庫,機器通過網頁抓取、篩選等技術,向用戶推薦最佳答案。
開放型交互:這對機器的上下文語義銜接、靈活度要求非常高,以達到真正的人機情感溝通,如聊天機器人等。目前該項技術仍處于探索階段。
總的來說,語音搜索引擎對 AI 有兩方面的要求,一是對用戶語言的理解能力,二是基于海量知識庫的應答能力。
AI 對話的技術模塊
AI 對話所需要的技術模塊有 4 個部分,分別為:語音識別(目前相對成熟)、語義識別、云計算、海量的語料訓練。

語義識別主要基于上下文的自然語言處理技術,主要由 5 部分組成:
1.意圖識別,識別用戶在搜索框內輸入的內容或問題,理解用戶的意圖并給出相應的回答。
2.情感識別,主要應用在與聊天機器人的開放式聊天當中,機器人能夠識別出用戶在對話過程中所表達的情感,并以正確的情感回應對方,這些情感包含 21 個類別。
3.指代消解和省略回復,比如用戶提問:「上海的天氣如何?」,在得到回答后繼續提問:「北京的呢?」,雖然沒有提及「天氣」二字,但機器能夠根據上下文語義理解用戶提出的問題并作出相應的回答。
4.意圖澄清,比如用戶要求看「藍蓮花」,那具體是圖片還是書籍?機器人則會進一步向用戶詢問,得到切確的答案后以做出正確的執行。
5.拒識判斷,當用戶提出的要求超出規范允許的范圍,如反動、色情的內容,機器則拒絕不答。
另外,機器人在應答層存在一種「多輪對話」的技術,在有些時候,用戶需要與機器進行多次對話后,才能將意圖表達完整。
而在人機對話過程中,用戶難免會出現表達失誤的情況,導致機器對用戶語言理解出現偏差,在這時,糾錯機制對機器而言則非常重要,如缺少這個機制,用戶需要花費相當長的時間將其意圖解釋清楚,相應的用戶體驗也會十分糟糕。
對話邊界的區分、確認也是機器應答需要具備的機制,用戶表達的意圖到下一個意圖之間、每個意圖的確認均為機器對話智能化表現。
本文資料、圖片提供者:極客公園
如有語音識別,語音合成,自然語言理解的需求或問題,歡迎和我交流,13828815023手機同微信