ACT Talk丨閱面科技趙京雷:人工智能的本質是「人性」復制的過程,視覺模塊標準化是未來
ACT Talk丨哈工大何震宇博士:高校與企業之間互幫互助,才能更好的促進科研成果產業化
企業與高校應該是優勢互補、相互推動的關系,兩者如果能夠相互幫助,則能夠碰撞出火花。
在 ACT Talk 第二期活動中,來自哈爾濱工業大學深圳研究院的何震宇博士帶來了機器視覺技術相關的主題分享,為大家講解了機器視覺技術從算法研究到應用領域的實踐,并探討了高校成果如何產業化這個問題。何震宇博士多年來從事人工智能、機器學習、圖像處理、計算機視覺等領域的研究工作,擁有 10 余項發明專利及軟件著作權,主持國家、省市級科研項目10 余項。
機器視覺的核心問題與視覺發展的歷程
機器視覺的核心問題是如何描述圖像,每次機器視覺的重大變革都發生在描述圖像的基礎上:2000 年前后,出現了局部特征描述的算法,用以判斷兩幅圖之間是否匹配;2000-2005 年,出現視覺詞袋模型;2005-2012 年,出現了對象模板 HOG,DPM,隨后因為深度學習的出現,機器視覺發生了重大變革。

機器視覺發展的過程分為三個階段:
第一個階段:低層次的像素(圖像處理),對應研究的對象是矩陣的像素點、邊緣、角等低層次的圖像信息。
第二個階段:中層次的目標(圖像分析),能夠描述物體局部的特性,比如人臉、眼、耳朵等的結構。
第三個階段:高層次的符號(圖像理解),是對低層次和中層次信息的融合,例如描述一個人的行為。這一層與深度學習較為契合。

深度學習雖然火熱,但科研還是得踏踏實實
深度學習的神經網絡已有 60 多年的發展歷程,近兩年得到快速發展并引起業界的高度關注。何震宇認為,從學術界角度來說,不能因為深度學習的火熱而急功近利,而應在理論上有所拓展,踏實的做好相關工作。
目前,何震宇博士所在的哈工大團隊在深度學習的研究上已有不少成果,比如基于連通子圖分析的多目標追蹤(用以多人跟蹤的圖像識別技術)、基于多視角學習的單目跟蹤、基于深度學習的單目跟蹤、人臉檢測等,并已經發表了大量的學習論文,積累了一定數量的專利。

·基于多視角學習的單目跟蹤

· 基于深度學習的單目跟蹤
高校成果產業化的過程中,企業與高校應互幫互助
何震宇表示,高校成果如何實現產業化,是多數學者無法避免的問題,高校因主要將精力花費在研究成果的不斷出新、優化上,沒有足夠的物質條件、時間和精力考慮產業化,而企業因盈利需要會有相關的思路。兩者看似能夠互補但實際上存在分歧:兩者不是坐在同一條板凳上,企業注重成果的及時落地、變現,另一方的高校則更多的考慮,技術應經過不斷的實踐與優化,才能最終轉換成能夠落地的產品。
何震宇博士認為,做產品涉及到技術、資金、市場等各個方面,產品失敗十分的容易,成功則萬般的難,只要某個環節出現一點問題就會導致失敗。
何震宇博士說道,一個好的產品涵蓋以下四個部分:一是核心技術;二是強大、有效率的工程團隊;三是商業化,即產品能否抓住痛點,讓客戶為之買單;四是資本。要注意的是,資本不應急功近利,而是應該將這四者有機的結合起來,各方面做到位,才能將拼圖拼好。
何震宇博士總結道,企業與高校應該是優勢互補、相互推動的關系,高校有相應的技術、人才優勢,企業有商業嗅覺、資金、企業工程等優勢,兩者如果能夠相互幫助,則能夠碰撞出火花。