国产亲妺妺乱的性视频播放,9797WWW成人影片,99精品国产在热久久无毒不卡 ,西方37大但人文艺术人山踪林

Uploads%2farticles%2f13853%2fshenzhenware report image 5x4.007
|
2020-03-03

搜狗推出 8 麥陣列的 AI 錄音筆,拾音和轉寫能力大幅提升

錄音、轉寫、翻譯,不錯的生產力工具!

其實早在上世紀 90 年代,小型迷你錄音筆就被發明出來了。在之后的 20 年里,錄音筆的產品形態和基本功能基本上沒有變化。雖然存儲空間越來越大,錄音的音質越來越好,但并沒有本質的幫用戶解決問題。

那么錄音筆從本質上應該為用戶解決哪些問題?作為一家 AI 公司,搜狗在一年前推出第一款錄音筆 C1 的時候,就曾經思考過,如何用「以語言為核心的 AI 能力」去驅動錄音筆,讓它能夠為用戶提供更好的使用體驗。

這其中的思考方向有三:

  1. 更好的拾音能力,用人工智能的能力增強人聲,這樣聽起來講話的聲音更清晰;

  2. 更準確的轉寫能力,能夠把錄下來的聲音準確地轉成文字,兼顧準確率和轉寫速度;

  3. 更高效的整理和使用這些錄音和轉寫文字。

△ 搜狗 2019 年發布的錄音筆 C1 Pro

在錄音筆這個不算很大的垂直細分領域,不難看到一些被吐槽「錄音效果甚至不如手機」的渣渣產品,不外乎幾個原因:硬件配置不夠,錄音和轉寫能力不夠,整體使用體驗不佳。

在經歷了這些年在消費電子市場的摸索、以及在軟硬件產品能力的積累和沉淀后,搜狗在 2020 年 2 月 26 日,通過線上發布會的方式,重磅推出了 S1、E1 兩款旗艦級的 AI 錄音筆新品,在去年發布的 C1 的基礎上,進一步實現了產品功能的全面突破與升級。

△ 搜狗楊洪濤發布 S1、E1 兩款 AI 錄音筆

這兩款產品是如何做到「更好地拾音、更準確地轉寫、更高效地整理」呢?我們從整個錄音到整理的過程來看,搜狗是如何在這兩款產品上「下血本」的。

8 麥克風陣列 + AI 降噪,大幅提升拾音能力

在錄音的過程中,不管是使用錄音筆、還是手機的錄音軟件,經常會遇到各種噪音干擾的情況,比如會場里竊竊私語的聲音,比如會議室的空調聲、敲鍵盤聲、翻閱材料的聲音,比如咖啡館里的背景音樂、電話鈴聲和各種人來人往的雜音......如果錄音的時候不加處理,就會導致錄音者的人聲不清晰,甚至被噪音覆蓋掉。

搜狗 AI 錄音筆首先從硬件的層面解決噪音的問題。S1 配備了 2 顆哈曼 10mm 指向性麥克風 + 6 顆全向麥克風。通常智能手機只有最多 2 個麥克風,而智能音箱也不過 4 個麥克風。

在會議和采訪模式下,將錄音筆平放的時候,可以實現 360° 方向的聲音收錄,并對各個方向的聲音進行平衡;而在聽課模式下,麥克風則指向正前方,通過波束采集較遠處主講人的聲音。

在實現全向錄音后,搜狗還利用了 AI 降噪技術,對麥克風的拾音信號進行三個層面的優化處理。基于麥克風陣列算法,首先在空間層面,通過增強人聲、去除背景音,優化 8 個麥克風的全向信噪比。

△ 現場演示 AI 降噪功能

而針對與人聲同時被錄入進來的極端噪聲,則通過判斷時域、頻率的特征,進行去除。此外,當遇到一些無法判斷特征的不確定的噪音時,搜狗還能利用神經元和 AI 學習的方法,對噪聲進行判斷和區分。

據搜狗介紹,在 S1 上采用的這個 PureVoice AI 深度降噪算法,能夠過濾 4 萬余種真實噪音。

合并輸入法詞匯,支持多語言和方言,全面提升轉寫準確率

現如今,無論是媒體從業人員,還是各行各業常常開會和聽講的人,對于錄音筆的需求已經不局限于錄音這一個功能上,錄音后的文字轉寫功能,已經成為這些人的「剛需」。

搜狗 S1 在錄音的同時,還可以實時轉寫文字,并同時顯示在屏幕下方。而在錄音完成后,將文件上傳云端,還能完成通篇的轉寫。理論上,1 小時的錄音生成稿件可以在 5 分鐘內完成轉寫,識別率達到 98%。

如何通過技術手段來確保這一過程的高效呢?在遠場語音識別技術之上,S1 還利用了搜狗輸入法背后的語音技術,當用戶在錄音筆上登錄搜狗賬號,就可以在服務器上合并個人的語匯,從而獲得更符合個人需求和準確率更高的語音識別。

△ 現場演示上課場景的定向拾音 + 實時轉寫

搜狗輸入法每天有接近 6 億次的活躍用戶,每天會產生 10 億次的語音請求,這些數據可以對語音識別和轉寫進行支持,從而可以準確識別一些通常很生僻但已經在用戶數據庫里的詞匯,比如通訊錄里的人名,或者用戶經常輸入的專業詞匯。

搜狗的 AI 錄音筆還支持中英日韓德等 10 種語言、以及川粵津陜貴等 10 種方言的錄音和轉寫。除此之外,搜狗語音團隊經過長時間訓練創建的財經貿易、醫療衛生、IT 科技、政法、文化體育 5 個專業領域的語言模型,也應用到了此次的新品,從而提升了行業特有詞匯的識別準確率。

△ 搜狗 AI 錄音筆背后的技術

智能標注、智能摘要、語音查找,高效的文稿整理功能,外加同聲傳譯

在實際的工作中,我們總能遇到錄音時間過長、轉寫之后文字篇幅很大、錄音文件較多的時候,查找起來費時費力。

△ 對轉寫的文稿進行智能標注

搜狗錄音筆具備智能標注的能力。當有多個人講話的時候,錄音筆可以辨別不同的講話人,并進行標識;甚至還能在有掌聲、笑聲的部分進行情緒標注;并自動去除一些口頭語、重復的詞匯。按下 M 鍵,即可在轉寫生成的文稿里查看這些標注,一目了然。

△ 現場演示:多人會議場景時的實時轉寫+智能標注

基于 NLP 技術和關鍵詞搜索技術,搜狗還推出了業內首創的智能摘要功能,可以自動提煉錄音文稿的主題和關鍵語句,方便用戶對轉寫內容進行整理。

此外,搜狗 AI 錄音筆還支持用語音一句話查找錄音內容。

△ 長按 M 鍵喚醒語音助手,可啟用語音搜索

在云端存儲技術的加持下,用戶還能在錄音筆、手機 App、網頁、PC 客戶端等多端自動同步和管理錄音數據,并實現一鍵導出、掃碼分享等便捷操作。

而在中英文的轉寫方面,搜狗 AI 錄音筆還能實現個人同傳功能,聽英文報告的時候可以實時進行翻譯。

△ 實時中英互譯,轉寫結果可以實時共享給其他人

S1 還支持全球 63 種語言的在線翻譯,以及中、英、日、韓、法、俄等 9 種常用語言的離線翻譯,同時還能實現自由對話翻譯功能。

價格和其他

續航方面,產品可滿足待機 20 天、滿電續航 10 小時。而 S1 還配備了內置的存儲卡和 4G 卡槽,定價 2698 元。

同時發布的 E1 是 S1 的親民版,定價 1298 元。E1 具備與 S1 相當的 AI 能力,只是屏幕要小一些,只支持 Wi-Fi 聯網。

自去年搜狗發布 C1 之后,搜狗就將其 AI 服務向錄音筆行業的合作伙伴開放,包括語音識別技術、搜狗輸入法賬號服務體系、個性化語言識別、多端同步的云端編輯能力、云存儲服務能力等,并與索尼、萬城集團、愛國者、紐曼等硬件設備制造商展開合作。

在主流電商平臺上,自 2019 年 3 月搜狗產品發布以后,AI 錄音筆的銷量快速增長。在今年一季度的錄音筆市場,AI 錄音筆已經占據了 1/3 左右的市場份額。

總的來說,S1 和 E1 無論是硬件配置還是 AI 技術的加持,都是一款「上得了廳堂、下得了廚房」的好「伴侶」,可以極大的提升工作效率。而具體的錄音和轉寫的一些細節體驗方面,還真需要領回家慢慢感覺才好做判斷。

微信號:shenzhenware

主筆、編輯:大零 / 深圳灣

>>
Back to top btn
主站蜘蛛池模板: 阳西县| 剑川县| 萝北县| 吴堡县| 九寨沟县| 绥德县| 常宁市| 泸溪县| 乾安县| 炎陵县| 凤山县| 甘洛县| 华容县| 虎林市| 昌宁县| 精河县| 宾川县| 丰原市| 普兰店市| 十堰市| 色达县| 砀山县| 临清市| 和林格尔县| 卢湾区| 大竹县| 广饶县| 宝兴县| 治多县| 庆元县| 紫阳县| 龙岩市| 通许县| 崇仁县| 南城县| 托克托县| 金坛市| 开封县| 松原市| 通道| 湘潭市|