從搜狗的語音技術發展史中,我們來看平臺技術是如何落地的

這么多翻譯機,搜狗家的翻譯寶何以解決境外旅游的痛點
兩款智能硬件產品,更多的是搜狗圍繞著「語音」所積累的各項技術能力和產品化能力的集成和體現。
1 月 24 日,搜狗在北京國貿舉行了 2018 合作伙伴大會。會上,王小川詳細闡釋了搜狗圍繞著「語言」處理為核心,布局 AI 的戰略。而讓 AI 戰略落地,搜狗首先圍繞著「翻譯」功能,發布了「搜狗旅行翻譯寶」與「搜狗速記翻譯筆」兩款硬件產品。
用搜索扛起「打破語音壁壘」的旗幟,在翻譯領域推進 AI 產品化
作為一家成立 15 年的「老牌」互聯網公司,搜狗一直以語言為核心做技術積累。在語音方面,搜狗已經有語音識別、語音合成、聲紋識別等能力;在圖像方面,搜狗在烏鎮世界互聯網大會上亮相了唇語識別,將語音與圖像進行結合;而在問答技術、對話技術、翻譯技術等知識計算領域,搜狗都有領先的技術能力和落地的產品。

搜狗在 AI 產品化方面頻頻秀成果。而在對話和問答以外,搜狗發現,語言處理技術今天 90%~95% 的實用集中在翻譯領域。「翻譯技術走向實用化的歷史意義,不亞于人類發明了電。」也正是基于這樣的思考,在過去的一年里,搜狗不斷的在翻譯領域做出了不少動作:
- 在 2017 年烏鎮世界互聯網大會上,搜狗展示了中英機器翻譯技術,用戶手里拿接收機、戴上耳機、就會聽到有語音合成的翻譯加入進來。
- 搜狗英文搜索可以將中文翻譯成英文,再檢索全球信息后翻譯成中文供閱讀,還可以通過中文搜索英文信息。
- 搜狗輸入法提供自動翻譯能力,無論是語音還是敲鍵盤,都能把用戶輸入的中文內容轉成英文。
- 基于英文語言的全球搜索,用戶在搜狗搜索里面找到一個詞之后,搜索也會給你展現國際信息版塊。
- 而在最新升級中,搜狗不僅可以搜索英文,還提供日文搜索。
- 在通用搜索中,根據用戶需求提供日文、英文、韓文被翻譯之后的信息,點擊應用之后可以看到中文答案。
聚焦境外旅游場景,要有離線翻譯和語音識別兩大技術能力做支撐
搜索解決了對外檢索的需求,輸入法能使在線交流變得更加簡單。為了讓跨國交流更簡單,搜狗還要從線上走下線下,首先聚焦的就是境外旅游場景。
為境外旅游提供翻譯 APP 的產品不少,但是 APP 放在手機里面還是有兩大痛點:
1. 網絡信號不穩,即便是全依賴在線服務,不僅成本過高,品質也不好。
2. 翻譯不準確,翻譯技術跟語音識別緊密相關,而今天大部分手機沒有麥克風陣列,在嘈雜環境收音準確度不高。
翻譯不準確不僅需要解決翻譯問題,還要解決語音識別問題。這需要兩大技術。
1. 云端在線服務,解決上網要漫游費和網絡不穩定的問題。搜狗擁有業界領先的神經網絡壓縮技術,離線翻譯在離線模式下做壓縮,使離線模型壓縮在線五分之一,而在手機或者其它終端設備里,壓縮程度為三十五分之一。同時,儲存問題和識別得到解決,模型精度接近無損,并且實時響應。
2. 在語音識別方面,搜狗積累的定向波束能力,在空間當中掃描,找到最強聲音,跟蹤它以避免噪音干擾。在汽車、飛機等有規則的噪音環境中,搜狗還可以實現持續降噪。在語音增強的技術方面,搜狗可以實現放大原聲。基于這些技術,實現在噪音環境下語音識別也能達到最高水準。
據搜狗官方稱,測試表明,搜狗的聲音處理能力超過蘋果,蘋果的聲音處理是最高水平之一。
一款翻譯寶,一款速記筆,解決「網絡不好」和「翻譯不準」兩大核心問題

基于搜狗自研的深度循環神經網絡機器翻譯、語音識別、麥克風陣列、圖像識別等多項技術,搜狗發布了「搜狗旅行翻譯寶」與「搜狗速記翻譯筆」兩款智能硬件產品,更多的是搜狗圍繞著「語音」所積累的各項技術能力和產品化能力的集成和體現。
搜狗旅行翻譯寶將為用戶解決「網絡不好」和「翻譯不準」這兩大核心問題。產品主要亮點如下:
- 離線翻譯:采用業界領先的神經網絡壓縮技術,將龐大的云端翻譯模型壓縮到 1/35 放入機器,模型精度接近無損,離線翻譯效果媲美在線水平,讓人們再也不用擔心突然斷掉的網絡,給人們帶來完美的跨國旅行體驗。
- 雙麥降噪:獨特設計的指向性 I2S 雙麥克風陣列結合波束成形、環境降噪、自動增益等技術,可有效降低環境噪音,實現4-6米收音清晰,有效提高翻譯準確度。
- OCR 拍照翻譯:位于設備頂部的獨立 OCR 翻譯按鍵,一鍵就能開啟拍照翻譯。OCR 文字識別技術打造強大的圖像識別引擎,與強大的翻譯系統相結合,能讓路牌、菜單等視覺信息瞬間被翻譯,讓陌生語言變熟悉。
- 17 種語言,覆蓋 200 多個國家:通過在線翻譯、數據更新等操作的技術,能夠實現包括中文、英語、日語、韓語、西班牙語、阿拉伯語語言的無障礙溝通。
- 工藝設計:機身采用整塊鋁板數控機床切削成型,強度高、總量輕、手感佳,特殊的R角切削工藝,加工難度遠超世面手機外殼,打造完美觸感。
搜狗速記翻譯筆可以實現錄音轉文字,同傳翻譯。說話不用太擔心距離問題,遠場拾音,確保聲音輸入;即錄即轉,翻譯與繼續溝通零延遲;藍牙鏈接手機,即刻開始翻譯。支持 17 種語言,形態小巧,攜帶便捷。
搜狗旅行翻譯寶定價為 1498 元,搜狗速記翻譯筆定價 299 元。兩款產品將在 3 月 12 日,京東首發。
目前,搜狗發布的這兩款硬件,還在備貨待發售階段。我們期待著這家狠心抓技術、用心做產品的公司,能夠在開春,給我們帶來一款出境旅游的爆品。(主筆:陳壹零 / 深圳灣)
從機器同傳,到搜索、輸入法、翻譯 App,再到搜狗旅行翻譯寶,搜狗從軟件到硬件的布局正不斷深入、全面開花,搜狗旅行翻譯寶的推出標志著搜狗正式入局翻譯領域,成為機器翻譯市場的重要玩家。搜狗旅行翻譯寶旨在解決用戶國外出行語言上的三大難題:離線翻譯(當前僅支持中英互譯),拍照翻譯,多語種互譯(18種語言在線互譯)。與同類產品相比,該產品價格適中、功能強大、翻譯較為精準,被很多媒體評價為“第一款真正實用的翻譯機”,可見搜狗在語言方面AI應用下了大力氣。接下來,搜狗旅行翻譯寶的重點可能是拓展離線語言互譯功能,當前18種語言在線互譯能夠覆蓋200多個國家和地區,能夠滿足國人出國的需求,但離線狀態僅支持中英文互譯,拓展更多離線互譯后,這款產品將真正成為國人出國旅行的利器。
cool!
cool!