一場關于機器視覺理論的分享活動,讓大家仿佛回到了大學校園 | ACT Talk #2 圖文回顧

港中大劉云輝教授談機器視覺技術的行業滲透和商業落地 | 活動回顧
機器視覺就像機器人的「眼睛」,感知周圍環境,通過反饋的圖像信息規劃機器人的動作。
機器人是靠自身動力和控制能力來實現各種功能的一種機器,而機器視覺在整個機器人的運動控制中占據著重要的地位。它就像機器人的「眼睛」,感知周圍環境,通過反饋的圖像信息規劃機器人的動作。
在本次 ACT Lab 和深圳灣的聯合活動上,邀請了香港中文大學天石研究所所長劉云輝,歡創科技 CEO 周琨,大道智創聯合創始人邢志偉,以「機器人控制系統與視覺的融合」為主題,向在場的機器人創業者分享他們機器人的研發和創業經驗。
機器人控制與機器視覺的融合
目前機器人或者機械臂所抓取的物件基本上都是剛體,很少能對變形體進行抓取。其實,在日常生活中,很多物件并不是棱角分明并且內部結構堅硬的剛體,而是以柔性體的形式存在,比如日常所穿的衣服、吃的食物、線材、柔性 PCB 以及人體組織。
劉云輝教授認為,在需要操作形變體的領域中,醫療健康對該技術的需求最強烈并且對操作的精準度也更高。劉教授結合自身的研發經驗補充說:「醫療手術機器人的研發主要有三個挑戰:首先是安全性,醫療手術中不能容許半點差錯,所以如何保證手術機器人的安全性,以及與操作醫師的有效配合是重中之重;保證安全性后,機器人如何在柔軟的體內進行解剖和組織切除,機械結構如何設計,視覺系統如何設計,就是研究人員面臨的第二大挑戰;第三,如何讓不懂機器人技術的醫生快速上手操作,人機交互如何設計,則是第三個挑戰。」
為了應對這三大挑戰,劉教授針對性地提出了三個解決方案:首先,手術機器人可采用小尺寸的、彈性的、或者柔性的機械結構,在保證操作精度的同時防止人體組織被機械所傷;第二,在機器人內部嵌入多種傳感器,比如 IMU、聲音傳感器、體感設備、眼球跟蹤設備等,增強機器人的功能,并簡化操作方式;第三,通過在機器人中內嵌攝像頭,以圖像引導的方式實時獲取手術反饋。
另外,劉云輝教授還說到:「目前,大型工廠的室內物件搬運 70% 靠的是人工駕駛叉車進行操作,但隨著從事重體力勞動工人的人工成本上升和人力資源的短缺,對很多行業產生著重大的影響,移動機械的自動化改造需求迫切。」
研究發現,室內移動器械自動駕駛的挑戰主要有兩點:一是無 GPS 的定位和制圖,二是精確的運動控制。憑借多年的圖像傳感器研發經驗,劉云輝教授將 Visual SLAM 算法和 RGB-D 傳感器集成到移動機器人的視覺導航模塊上,并應用于移動機械平臺,實現了低速且高精度的自動駕駛功能。
劉教授表示,目前為了保證安全性,移動器械的速度并沒有做得太快。不過,制造業、建筑業、采礦業、物流業等領域對室內移動器械自動駕駛有強烈的需求,所以,該項技術在未來會有很大的發展空間。
技術公司如何商業化
歡創科技為移動設備、機器人、無人機、TV 等行業提供空間定位與識別系統,成立僅三年時間,就已經在細分領域做到了第一,今年銷售額預計突破 2000 萬,并且在去年下半年開始盈利。
初創公司如何快速發展,周琨給出的答案簡單粗暴:「在細分領域做到第一,而且只做第一,不做第二。」
具體如何做才能成為細分領域的第一呢?周琨的方法論是這樣的:省花錢、砸技術、點突破。
對于初創公司來講,最困難的就是不是找投資,找人脈,而是找方向。很多公司在頭三年拿到投資后,就盲目地擴張,最終只會導致資源無意義地消耗,所以找到適合自己的發展方向很重要。
關于企業技術的積累,周琨認為,只有人、錢、時間三者的堆積,才有可能將技術打磨好。以自身為例,周琨做清華大學深圳研究生院碩導,在計算機視覺領域積累了多年的研究經驗,。除了自身技術經驗的積累,初創企業還可以通過引進外部團隊的方式增強自身競爭力。
什么是「點突破」?周琨表示,每個創業團隊應該找到適合自己的細分領域,找到自己的生存空間,歡創科技看到了智能電視的蓬勃發展,以及該行業對計算機視覺技術的強烈需求,才下定決心深耕智能電視的體感配件,最終做到了細分領域第一。
SLAM 在自主移動機器人上的應用
如果機器人可以像人一樣進行思考的話,那么它們主要面對的「哲學」問題應該是這三個:我在哪?這是什么地方?該往哪里去?翻譯過來其實就是三個關鍵點:定位、制圖、導航,而這就是 SLAM(simultaneous localization and mapping,即時定位與地圖構建)技術所要解決的三個主要問題。
邢志偉認為,SLAM 不是指某個算法,而是一類算法的集合。當開發者考慮讓機器人更加智能時,如何實現自主移動往往是他們需要解決首要問題,作為自主移動的突破點,SLAM 自然成為了人們關注的焦點。
目前,SLAM 的實現主要有兩種方案,一個是基于激光雷達的方式,另一個是基于攝像機的方式。基于激光雷達的方式應用得比較廣泛,業內對此方法的研究時間較長,優點是速度快、精度高,不過價格也會比較昂貴。基于攝像機的方式價格低廉,攝像機反饋的信息量大,不過,正由于豐富的信息,所需要的計算量同樣很大,而且攝像機容易受外部光線的影響。
邢志偉說,Visual SLAM、ORB SLAM、LSD SLAM 均為常用的 SLAM 算法,開發者應結合自身技術優勢以及應用場景酌情選擇。不過,SLAM 在發展的過程中仍然面對著一系列的問題和阻力,比如傳感器的精確度不夠、傳感器應用場景不具備普適性、超高的計算量等。
多傳感器融合、回環檢測、重定位精度等都是 SLAM 在未來重點發展方向,上述的問題也會隨著技術的發展和產業的成熟而得到解決,最終 SLAM 技術將會應用得更加廣泛。
現場的機器人從業者認真聆聽專家們的分享
圓桌討論時間
現場觀眾正在向專家們求教
活動結束后,討論還在繼續