何止 Meta x Oakley,小米等十家 AI 拍攝眼鏡上新!下半年好看!

Rokid 攜手聲網,走一條和 Facebook 不一樣的路
戴眼鏡的都是主角,而在走向三維空間的過程中,Rokid 選擇了 AR。
9 月 23 日晚,以「新視界·大可為」為主題的 2021 Rokid 合作伙伴暨開發者大會通過線上直播的方式與大家見面了。
Rokid 攜手合作伙伴共建行業生態,重磅發布了 10 億元「空間站」AR 生態智投聯盟計劃,同時發布了最新的消費級 AR 眼鏡 Rokid Air。

作為 XR 行業里積極探索的 Rokid,面對元宇宙的一輪風暴,是怎么思考、怎么實踐、又是如何走出迷局的呢?
走近元宇宙,互聯網由二維向三維空間進化?
隨著互聯網基礎設施的完善,5G 的推廣乃至呼之欲出的 6G,全球前沿科技公司都在 AR 和 VR 領域加速布局……
這些都在昭示著,互聯網技術日臻成熟,正在由二維向三維空間進化,人類智者早已預見:1992 年「元宇宙」被小說家提出,2010 年「數字孿生」被 NASA 定義。
扎克伯格接受采訪時多次提及元宇宙概念,要把 Facebook 轉型成為一家元宇宙公司。
近日 Facebook 的 Horizon Workrooms 發布后,引起了熱議。是否這樣的 VR 會議將成為未來的工作方式?

想得更遠一點,我們要把工作和生活的重心向數字空間轉移嗎?
Rokid 認為,元宇宙也好,數字孿生也罷,科技終將為人服務,讓現實世界變得更加美好。
目前走向三維空間有兩種路徑,一種是虛擬現實(VR),另一種是增強現實(AR)。Facebook 選擇的路線就是前者,虛擬人在 Workrooms 協同辦公,具有 VR 的傳統優勢,沉浸感更強;而 Rokid 從一開始就走了后一條路,增強現實,讓數字內容成為人的「超能力」,解決現實世界的問題。
元宇宙放一放,先把 VR、AR 搞明白
為什么 Rokid 選擇 AR,不選擇 VR 路線呢?
過去數十年間,現實世界和數字世界存在許多裂痕。人、真實世界、虛擬世界,我們應該置身于何處?
Rokid 認為,未來的交互平臺,不應割裂現實世界和數字世界,而是要實現人、數字世界和現實世界三個對象的融合交互,讓人們擁有平等的機會從科技發展中獲益。

Rokid 致力于 AR 眼鏡等軟硬件產品的研發及以 YodaOS-XR 操作系統為載體的生態構建,積累了大量的 XR 能力,這些能力恰恰是元宇宙的五色土,為元宇宙的物種生長輸送營養。
Rokid 不斷探索感知力、理解力、協同力、展現力、數字(內容)資產生產和管理的能力,并把這些能力賦予開發者和合作伙伴。
Rokid 與聲網達成戰略合作,共同向下一個時代邁進。
應對變化,Rokid 邁出的第一步是將攜手合作伙伴打造出一個能夠自由創作并形成數字資產,最終讓人、現實世界、虛擬世界協同的空間——Rokid MSpace。
想必大家會很好奇:
MSpace 這個空間怎樣讓人有身臨其境之感,它又是如何使虛擬世界與真實世界自然融合在一起的?
走近 MSpace,身臨其境的有求必應屋
我們判斷是否在現場,與他人同處一個空間,主要依賴我們的感知系統——視覺和聽覺。
視覺方面,戴上 Rokid AR 眼鏡可以看到 3D 虛擬人出現在空間里,虛擬人的手勢、口型、神態由 Rokid XR 能力的語音識別、手勢識別、圖像識別、體態識別、情緒識別、眼動追蹤等技術支持,讓虛擬人可以與人、與環境實時互動。
例如,AI 技術讓真人語音支配虛擬人的口型變換,給人觀感更加擬真。

聽覺方面,聲網的聲場渲染技術給予人聽聲辨位的能力,能聽出發言者的空間位置。聲場渲染除了讓人聽聲辨位,還能給聲音本身施加特效,MSpace 可以變身成在線 K 歌房、直播間,美聲、娃娃音、海豚音……千人千音不是夢,每個人都可以成為歌手!
MSpace 也可以變成能隨時登錄的自習室,當你上網課想放棄時,前后左右同學的數字虛擬化身都還在,空間里只有鍵盤打字記筆記的聲音。
MSpace 還可以變成一個家庭休息室,忙碌的父母在工作日的午后也能陪孩子搭積木。

實時互動,全息溝通
賽博空間有無數個魔法快遞員(bit),他們把你說的話、你此刻的表情動作畫面飛速打包,瞬時傳遞到千里之外。
這種快遞速度哈利波特騎著飛天掃帚也不行,也就孫悟空的筋斗云能與之一較高下,不過還得給孫大圣留出一個翻跟斗的時間。當網絡堵車時,快遞員們背著大包小裹都往前沖,包被擠掉了、快遞員遲到了就很正常,這種現象就是「丟包」和「延遲」。

要想讓 MSpace 維持運轉要有個基本的能力,就是實時互動。
剛才提及的聲場渲染就歸屬于一個更大的技術概念 RTE——Real Time Engagement,它的前身是 RTC——Real Time Communication(實時通訊技術),如果不知其原理還挺魔幻的。
聲網提供實時音視頻互動體驗質量保證,其自建的 SD-RTN? 軟件定義實時網,覆蓋 200+ 國家和地區,特別針對東南亞、中東、北美和國內中小城市做網絡優化。

此外,基于聲網音視頻編解碼專利算法和優異弱網對抗能力,能夠實現 80% 丟包下音頻通話流暢,70% 丟包下視頻通話流暢。
這是什么概念?就好像完型填空聽力版只聽到 20 個詞,有人卻能把剩下 80 個猜出來,完整地轉述他人;一幅 100 塊的拼圖,只有 30 塊,高手就能把整幅拼圖復原。
RTE 則是 RTC 的進階版,如果說 RTC 是代表著人與人之間的信息互換的話,那么 RTE 除了信息互換之外,更重要的是還有情景的共享。
比如在課堂上,除了老師和學生的聲音和視頻之外,還需要有老師的白板演示,學生舉手回答問題。聲場渲染可以傳遞信令,老師在白板上畫畫的筆跡就屬于信令的一種,因而 RTE 技術在教育、遠程協作等領域應用較為廣泛。

如果說 Rokid 將構建的 MSpace 是一個魔力空間,你的想象可以隨時具現;那么聲網就是讓你千里之外「全息溝通」的魔法石。
科技放大善意
Rokid 認為,人和科技要友好相處,在數字經濟盛行的時代,不能忽略真實世界的美麗與溫暖。增強現實是把虛擬內容疊加到現實世界,讓現實世界更加美好,更有利于消彌科技發展產生的隔閡。
Rokid 的 AI、AR 產品已在全球 70 余個國家和地區投入使用,有效提升用戶體驗、助力企業增效、賦能公共安全。
科技可以放大善意,幫助弱勢群體。
譬如,AR 眼鏡可以把識別到的手語和識別到的語音相互轉換,幫助聽障人士溝通。對于視障人士而言,基于 AR 眼鏡的物體識別能力能提醒他規避障礙物,當路線中有危險時,AR 眼鏡語音助手小若琪可以發出語音提醒甚至報警。AR 眼鏡還可以調整環境色溫和成像,增加了顏色的辨識度并提高了成像效果,能夠實現良好的色盲矯正。

當然,有了基礎的技術,這一切功能實現都離不開廣大開發者的參與。Rokid 希望讓科技與人和諧相處,讓每個人都能享受到科技帶來的獲得感。
Rokid 全棧自研 YodaOS-XR 系統,提供各種算法能力和 PaaS 服務,打造了 Rokid AR Platform(ar.rokid.com),Rokid 將自身的技術能力開放給各行業的 ISV 和 SI,面向生態開發者和行業客戶提供各種平臺能力與解決方案,服務千行百業。
編輯:曉月、陳述 / 深圳灣