ACT Talk丨哈工大何震宇博士:高校與企業之間互幫互助,才能更好的促進科研成果產業化

ACT Talk丨閱面科技趙京雷:人工智能的本質是「人性」復制的過程,視覺模塊標準化是未來
在未來,機器人的視覺模塊能夠標準化,可被接入各種機器人中,就如藍牙模塊、WiFi 模塊,手機上的攝像模塊一樣。
本周,閱面科技創始人趙京雷應邀出席 ACT Talk 的第二期活動,以他從事深度學習和計算機視覺十多年的經驗,講述了人工智能發展的歷程,以及他對人工智能本質的理解。
以人類歷史上的幾次產業變革為時間維度,人和機器的關系發生了這樣的變化:在工業革命時代,我們賦予機器勞動能力,幫助人類減輕工作負擔,也就有了后來的工業產線,這個影響一直延續到今天。在信息革命時代,互聯網、社交網絡進入到了人類生活當中,人們將計算能力逐步向機器轉移,繼而出現了各種移動設備。
人工智能革命的本質:人性復制的過程
如今,普羅大眾都在談人工智能,那人工智能時代的本質是什么?已從事多年算法開發的趙京雷深深體會到,深度學習算法能夠將算法做得更準確,但同時他也認為,深度學習算法無法幫助以往的信息時代產品進入人工智能時代,因為其中缺少了「人性化」這個基礎,他進一步指出,人工智能革命的本質是人性復制的過程。
兒童視覺習得的過程分為三層,第一層是本能層(1-2 歲孩子與生俱來的本能),第二層是習得層(通過后天習得),第三層是專業層(專業人士所具備)
趙京雷認為,本能層的視覺能力包含兩點:一是通過視覺層面對人進行理解的能力,二是對所生活的空間進行理解的能力。作為一家視覺技術公司,閱面科技將其所做的事情聚焦在了本能層上:賦予機器相當于兒童 1-2 歲的視覺能力,讓機器能夠理解人以及與人共生的環境,且具備人性化。

目標:機器視覺模塊標準化
趙京雷進一步表示,他們還要將這項本能層的視覺能力標準化,希望在未來,機器人的視覺模塊能夠標準化,可被接入各種機器人中,就如藍牙模塊、WiFi 模塊,手機上的攝像模塊一樣,一個模塊解決一個問題。
為了讓視覺技術能夠理解人,并能夠做出智能判斷,閱面在算法底層做了大量的工作,基本上打通了對人的理解、對空間的感知這塊算法的閉環,并盡量做得全面,達到多算法之間的配合,其中包括面部識別、手勢識別、人體識別等一系列的基礎算法。
另外,在空間感知層上,閱面科技也沒少下功夫,包括測距技術、視覺追蹤、視覺避障等,讓機器通過普通攝像頭識別可行走的路段以及障礙物,繼而構建出整個空間的感知系統。

目前,激光雷達、紅外傳感器能夠讓機器具備部分的空間感知能力,趙京雷表示,在未來,視覺技術可具備更強的空間建模能力后,將會替代激光雷達、紅外傳感器。
提供不依賴 GPU、功耗低、成本低的硬件視覺模組,與各行業進行緊密合作
對于許多做消費級產品的創業者來說,具備 GPU 的芯片功耗、成本都很高,閱面科技希望打破這一局面,讓深度學習算法通用化,將大量優化過的底層算法集成在低端的芯片上,滿足智能硬件制造者功對芯片成本低、功耗低、能夠實現動態計算的需求。
目前,閱面科技做出了不依賴 GPU、 4cm*4cm 大小的硬件視覺模組,集成了大量機器感知算法,即插即用。趙京雷進一步表示,他們最終希望的是將這些模組標準化,那樣也就意味著人工智能時代的真正來臨。

閱面科技已推出幾款模組產品,如具備人臉識別、人臉特征識別、手勢識別、人體跟蹤功能的人感視覺模組,另外還有供特定行業使用的專業級視覺模組,包括掃地機視覺模組,IPC 視覺模組等。目前已與服務機器人、人工智能系統、智能家居等行業、平臺、行業解決方案合作商進行緊密合作。