全系標配滿級防水,OPPO A5 系列新品正式發布

聊天機器人如何通過「知識圖譜」變得更加智能? | 活動回顧
知識圖譜通過對現有數據的挖掘、抽取、加工,將信息融合為統一的全局知識庫。
聊天機器人,是一種通過自然語言模擬人類進行對話的程序,很多大型互聯網公司投入重金研發相關技術,并陸續推出相關產品:蘋果的 Siri、微軟的小冰、百度的小度、Google Allo 等等,涵蓋娛樂、教育、醫療等領域。
本期來到 AI & ROBO Class 的嘉賓是深圳灣的老朋友 —— 王昊奮,他畢業于上海交通大學,曾任教于華東理工大學,如今是深圳狗尾草科技 CTO,在語義技術和圖數據管理方面有豐富的經驗。在活動現場,王昊奮結合多年的教學和研發經驗,為在座的機器人從業者分享聊天機器人面臨的機遇和挑戰。
聊天機器人的誕生比你想象中的早
在眾人眼中,語音聊天機器人似乎是近幾年才發展起來的新興事物,其實,聊天機器人卻已經經過了半個世紀的研究和發展。
早在 1966 年,計算機科學家約瑟夫.維森班就設計出了世界上最早的聊天機器人 —— Eliza,但是 Eliza 并沒有人們想象中的那么智能,而且只能完成針對特定領域的對話。它被設定為一個精神治療師,會模擬真實的醫生對用戶進行提問,比如「你對那件事感覺如何?」「你覺得那是什么意思?」,它會重復這些開放而模糊的問題。
隨后的幾十年里,不斷有新的聊天機器人誕生,比如 Dr. Sbaitso、「人工語言在線計算機實體」A.L.I.C.E 聊天機器人、IBM 的 Watson 以及我們現在已經熟知的 Siri、Cortana、Alexa 等。
王昊奮認為:「如今的聊天機器人,從應用場景上來看,可以分為在線客服、娛樂、教育、個人助理和智能問答五個種類。」 比如微軟推出的基于情感計算機器人「小冰」,其首要目的就是供網友進行「娛樂」,同時讓人工智能的概念在大眾中普及開來,而手機上的 Siri、小度、Google Now 的功能則更加工具化,用于個人語音助理,輔助用戶處理個人工作和生活上事物。
自然語言處理三步:自然語言理解、對話管理、自然語言生成
要實現人機間的自然語言通信,意味著計算機既能理解自然語言文本的意義,也能以自然語言文本表達既定的思想和意圖。具體來說,自然語言處理技術包括了自然語言理解(Natural Language Understanding)、對話管理(Dialogue Management)、自然語言生成(Natural Language Generation)三個部分。
自然語言理解包括很多層面,從語法上來講,它包括了詞性的標注,專有名詞的識別,形態的分析;從語義理解上來講,它包括了語言之間邏輯的推理,語義的計算,對話的理解;從文本篇章的層面上理解,它還包括情感分析,觀點提取等。
王昊奮指出,在歧義消除、用戶意圖識別、語言多變性的處理上,目前的自然語言理解還有很大的提升空間。「比如,我對機器人說,我想聽『海闊天空』,傳統的自然語言理解只能識別出這是一首歌的名稱,并不知道我想要聽的是 Beyond 的 『海闊天空』,還是信樂團的『海闊天空』,或者是其他翻唱的版本。」王昊奮說到。
當我們跟機器人聊天時,是希望可以有多輪對話,能夠一直聊下去,而不是單純的一問一答,所以對話管理就非常重要。對話管理指的是對話狀態的更新以及下一步動作的規劃執行,具體來說,它包括了對話狀態的跟蹤,對話策略的構建,用戶與對話媒介的情感建模,對話程序的個性建模以及話輪的轉換。
另外,在機器人在接收并理解了用戶的語言之后,需要找到最佳的語言表達方式將內容和思想反饋給用戶。整個自然語言生成的過程包括了內容選擇、文本規劃、句子合成、指代表達生成、表層實現等階段。
以目前的發展來看,自然語言生成還存在著很多不足,如海量的文法結構,上下文的整合,以及通過深度學習生成答復的對話模型很難解釋,而這些只能通過更好的語料和參數調整來改善。
知識圖譜能提供更有價值的決策支持
2012 年,「知識圖譜」的概念首先由谷歌提出,并且將此技術應用在 Google Now 語音服務上,從此,知識圖譜逐漸成為百度、搜狗等科技公司所追捧的語義分析技術。王昊奮從大四起就開始了知識圖譜的研究,而那時的知識圖譜還被叫做語義萬維網。

「采用了知識圖譜、邏輯推理機的機器人具有記憶功能,同時有一定的推理能力,使對話更加流暢自然。」王昊奮說。
知識圖譜為深度學習的訓練提供先驗知識,而基于知識圖譜設計的用戶畫像和個性設定,則能保證虛擬人物交互信息的一致性。
類比人類智慧的形成依賴知識和經驗,機器依靠知識圖譜和大數據,通過人工智能來類比人類。這里抽象知識積累所形成的經驗可以通過知識規則或深度學習的模型來刻畫,而深度學習訓練需要的大數據可通過知識圖譜的數據增強來實現。
具體來說,一個通用的結合了知識圖譜和深度學習的框架,依賴知識圖譜對輸入的文字進行實體和關系等語義理解,通過深度學習包括各種序列到序列學習的框架得到候選輸出,通過推理來做最后回答的排序和過濾來實現最后的輸出。
聊天機器人未來的機遇和挑戰

現場觀眾提問
在談到聊天機器人的未來時,王昊奮說:「以現在的發展來看,我認為聊天機器人在某些特定場景的應用會更加普及,比如客服,法律和醫療的咨詢。」
事實上,聊天機器人已經開始慢慢滲透至這些細分的領域中。IBM 的 Watson 機器人已經在醫院里輔助醫生對病人進行醫療診斷,另外,基于 Watson 的技術,IBM 推出了世界首位人工智能律師 ROSS。
當然,如今的自然語言處理和機器人技術遠不夠成熟,在長對話、上下文處理、個性化回答、意圖以及情商的體現上還相當欠缺。隨著時間的推進技術會不斷地更新迭代,彼時聊天機器人就能打開更廣闊的應用空間。