国产亲妺妺乱的性视频播放,9797WWW成人影片,99精品国产在热久久无毒不卡 ,西方37大但人文艺术人山踪林

Uploads%2farticles%2f11691%2fware       22.001
|
2017-07-19

哈曼宋柏勛:人機交互和人際溝通畢竟不同,語音到底怎樣做才算自然?| WARE 2017

盡管語音智能在追求像人一樣的自然交互,但人際溝通和人機交互畢竟還有許多差異的。

「我們談語音交互的時候,說的當然是人用語音跟機器交互。但現在我們思考的是,如何讓人與機器的交互方式回歸到像人與人交談一樣自然,這才是我們發展技術想要追求的目的?!?br>

在深圳灣「WARE 2017 語音智能平臺與應用峰會 第 II 季」上,哈曼(Harman)麥克風系統負責人宋柏勛比較了人際語言溝通和人機語音交互之間的異同,從語音交互的需求、人機聽覺的差異、以及聲音信號的處理等方面,淺析了如何讓人機語音交互更接近人與人自然對話的問題。

自然的交互≠完全相同

「現在語音技術的努力方向,主要還是在聽懂人在說什么,層面停留在人對機器的控制?!顾伟貏渍f,「而未來的需求則是要讓機器更了解你,帶有人與人交談的情緒性,知道你是誰,知道與你互動與其他人互動是不同的。」

盡管語音智能在追求像人一樣的自然交互,但人際溝通和人機交互畢竟還有許多差異的。

人機交互需要高的識別率,需要語音方面的強化,能夠通過聲紋識別分辨不同的對象,同時,還要求機器的可控。

「比如你讓它關電視它就要關電視,說了三遍它還沒反應你就覺得產品有問題了?!顾伟貏渍f,但人與人交談的重點則并不是追求這種絕對的控制。

人與人的交談,除了需要清晰的語音,還帶有情緒性,這種情緒語氣本身也在傳遞信息。此外,在聆聽的專注性上,人可以有意識地進行選擇。

二者的這些方面的差異,有的需要彌合從而增強人機語音交互的自然程度,而有的則是基于交互對象的固有差異,如何區分和兼顧這兩種差異,是實現自然語言交互的關鍵。

大腦并不是這樣「聽」的

現在的語音識別技術,多數是通過分析下圖這樣的聲音頻譜特征來識別語言內容。

「但人的聽覺感知可不是這樣基于聲音頻譜做傅里葉分析。」宋柏勛說,「人的聽覺是聲音引起耳蝸內基底膜振動,產生神經細胞興奮將振動轉化為脈沖電信號,傳遞到大腦的聽覺皮質來解析。」這與現在語音識別技術中使用的方式是十分不同的。

「我們嘗試用信號處理、機器學習等技術解決聲音上的問題,需要花費大量的資源,是因為我們在技術上認知的聲音特征和大腦所認知的是十分不同的,大腦感知聲音的方式在另一維度上?!?/p>

「這也是為什么人只要用兩只耳朵,就能在復雜的空間識別不同的聲音,在多個人講話的時候,專注聆聽其中一個人。這與人耳的構造、聲音信號傳遞過程中的控制和處理都密切相關。」

「這個過程中的聲音信號處理十分復雜,但神經心理等學科的研究已經發現這個過程中的許多機制,并試圖通過算法把這個復雜的機制轉化為可實現的信號處理方式,這是為復雜的聲音環境創造出更好信息處理方式的重要方向。」

哈曼想做的是人工智能的耳朵

作為一家一直深度鉆研聲音的傳統音頻廠商,哈曼試圖做的,就是在語音智能體系中為人工智能提供足夠好的「耳朵」和「嘴巴」,這也是哈曼公布 SONIQUE 語音識別方案的初衷。

哈曼專注的,是語音智能體系中的輸入和輸出端(左側)

「盡管語音智能在市場上已經開始興起,但在制造上,在如何控制好音質,如何自定義規格,以及好與不好的標準制定等方面都還面臨著挑戰?!?/p>

針對不同應用場景,哈曼開發了一系列麥克風元件和專門為語音識別設計的低失真喇叭,通過硬件和算法的搭配在不同場景下實現性能優秀的聲學解決方案。

哈曼的系列麥克風元件
哈曼專門為語音交互設計了的超低失真喇叭
針對不同應用場景,哈曼 SONIQUE 提供了多種解決方案


而在未來應用方向上,語音除了作為人工智能的交互接口,進行語音控制、語音通話等功能外,宋柏勛還特別提到了基于聲紋識別的個人化的重要性。最后,宋柏勛總結說,未來智能語音產業的發展重點,將落在訊號處理與機器學習的融合、市場專業分工化、產品落地與產業供應鏈完善、人機交互體驗的提升以及人才的培養等多個方面。

>>
Back to top btn
主站蜘蛛池模板: 平昌县| 晋江市| 尚志市| 烟台市| 通州区| 虎林市| 绵竹市| 成安县| 武隆县| 德令哈市| 新丰县| 梧州市| 墨江| 深州市| 嘉定区| 朝阳市| 泊头市| 沙河市| 宜黄县| SHOW| 沐川县| 三穗县| 祥云县| 仪陇县| 肇州县| 大理市| 栖霞市| 平罗县| 涿州市| 乌鲁木齐市| 玉山县| 嘉义市| 东莞市| 乌兰察布市| 台湾省| 青州市| 蒙山县| 澜沧| 古交市| 恩平市| 大兴区|