科大訊飛最新發布!打造下一代智能交互新范式

40 歲創業,讓機器有更靈活的「大腦」,他說強人工智能是一點一滴積累的過程
因為多年的經驗積累,靈聚在大方向和決策上沒有走過大的彎路,整體布局和技術架構也是建立在總結近十幾年的觀察和用哲學方法對未來的預測上。
「40 歲創業,我們沒有賭徒的心態,就是要腳踏實地把工作做扎實,不能打馬虎眼。在看得見的范圍內,一步一步把實用人工智能技術落地,強人工智能不可能突然降臨,是一點點解決問題長期積累的過程。」
創業是水到渠成,多年的經驗積累讓靈聚在大方向和決策上沒有走過大的彎路
在成立靈聚信息科技之前,張勝就已有多次創業經驗,早在 1996 年通過 FidoNET-BBS 結識了幾位編程高手,接著成立工作室,試圖開展程序定制開發業務。但接了兩個項目之后,工作室不了了之。
在多次的經驗總結后,張勝發現,如果在一個松散的環境下創業,沒有一個絕對領導和明確的商業規劃與目標的,不用開始就基本上可以被判死刑了。
1997 年,張勝進入了 IT 媒體行業,于 1999 年5 月創辦『電腦自做 PCDIY』雜志,該雜志創造了國內科技期刊創辦 6 個月銷量即超過 7 萬/期的記錄。張勝也因此成為中國最早倡導電腦 DIY 理念的人之一。
正值 IT 媒體行業黃金時期的他又轉而投身于游戲行業,至今還在做協助政府部門管理游戲行業的工作,做過多家公司的顧問,也在做高校的客座教授和創業導師。
說起創業,得從一次相遇說起,在一次偶然的機會,張勝在廣州碰上了同樣是年過 40 歲的同道中人,他們在討論中發現一個問題,為什么 Siri 及其隨后出現的語音助手并不能得到很好的普及?他們分析了這些語音助手的短板并且認為,在未來兩三年內,一定還會有新一輪智能助手的機會。
經過一番磨合后,他們于 2013 年 6 月在廣州成立靈聚信息科技有限公司,專注于人工智能領域的研究和創新,自主研發多項獨創技術,8 月份推出「靈聚人工大腦」。目前,靈聚智能引擎已經發展到了3.0 版本,其技術主要被應用在機器人、玩具、智能家居等產品中,還包括實現靈聚智能引擎的載體——機器人「NAO」。

· 張勝與他的機器人「NAO」
靈聚的商業模式主要聚焦在 B 端:采用 Licence、聯合開發、主動定制服務(例如 NAO 解決方案)等方式。核心部分,靈聚只做自己擅長的事情,除此之外,將產品和行業切入應用都交給合作伙伴。
「創業其實是一種情懷,并且能在合適的時間遇到合適的團隊,這是一種機緣。我很反對為了創業而創業的行為,創業是風險極高的游戲,當團隊經驗和資源不足的時候,往往就只能靠天賦和運氣來彌補。對我而言,四十歲開始創業,各種條件已充足并且水到渠成,是順勢而為?!箯垊僬f道。
「我和 CTO 都是過 40 歲的人了,各自完成了 20 來年的經驗積累,這里面有工作經驗、方法論、處世哲學、技術資源和社會資源的積累,自然也有大量的人脈?!?/p>
也正是多年的經驗積累,靈聚在大方向和決策上沒有走過大的彎路,整體布局和技術架構也是建立在總結近十幾年的觀察和用哲學方法對未來的預測上。
強人工智能并非一蹴而就,而是一步步解決問題和長期積累的過程
與其他人工智能引擎所走的通用化解決方案的路線(也就是提供通用化平臺,通過統一的接口解決不同場景的人工智能需求)不同,靈聚人工智能引擎則根據用戶需求提供定制化的「操作系統」,通過聚焦一個又一個實用場景,在落地的過程中完成變現和復制。
在張勝看來,強人工智能并沒有捷徑,而是一點點解決問題長期積累的過程。目前,靈聚已儲備了許多技術,包括硬件所需的硬件技術。與同類產品的差異性表現在兩個層面:
技術層面上:
1.無屏化智能交互,靈聚人工大腦可以支持所有內容和服務的無屏化智能交互;
2.初步的機器思維能力,當前靈聚人工大腦回答的知識性問題一部分是經過分析和計算后,由人工大腦自動生成的答案,而不再僅僅是對已有答案進行搜索和匹配(DeepQA);
3.完成復雜任務的能力,只要有明確的任務需求和應用場景,靈聚的多重技術復合使用,可以解決復雜的問題,最終實現產品聰明易用的體驗。
4.機器人肢體語言能力,該能力已經體現在對機器人 NAO 的支持上,并且解決方案已經開始全面商用。使用靈聚人工大腦的 NAO 已經不再需要提前編寫動作,面對海量信息的問答和閑聊,人工大腦會自己決定要機器人做什么肢體動作與正在說的話相配合。該能力可以擴展為對智能家居的統籌協同控制能力。
5.便捷的替換與開發,靈聚人工大腦的接入接口只有一個,所有的功能場景由人工大腦自動分析判斷,無需人工依照語義場景分別對接。并且,靈聚人工大腦的大多數輸出都是計算后的最終結果,而不是語義分析后的半成品。
應用層面上:
應用層面主要體現在商用化能力上,目前靈聚為機器人 NAO 開發的套件已經具有完整的解決方案,可以滿足講解、促銷、主持、輔助教學等方面的商用需求,用戶可以在完全不懂代碼的情況下進行內容的自定義,這套方案能被快速的復制到更多的機器人和玩具產品上。
面對硬件嵌入過程中的問題,還是要一步步解決并進行技術升級
張勝表示,在現階段硬件嵌入的過程中,面臨的主要問題是因靈聚新的技術架構帶來的溝通問題:
架構已升級:由單一的語義分析輸出分詞結果變成輸出更為豐富的結果。靈聚人工大腦目前輸出的結果已不再是單純語義分析的結果,而是經過機器思維處理的結果。所以,其使用方式及工作思路也與此前單純語義技術的接口大不一樣。為此,他們近期也在計劃與 Intel 合作共同向更多開發者說明。
控制命令已不再是簡單的語音語義方式:基于傳統語義接口技術研發的產品已經無法滿足高智能產品的指令需要。目前,靈聚人工大腦實際上已經能提供基于上下文、多輪交互和智能場景的命令模式,可為產品提供前沿的用戶體驗。
但有些產品的自定義內容采用了命令詞攔截的方式來實現,這就對嵌入帶來了新的問題:如果進行攔截,靈聚人工大腦的動態上下文(年底將升級為全局動態跨場景上下文)、多輪交互及基于推理、聯想、歸納和演繹算法的自動造句功能(年底上線)等將無法正常使用。
對此,張勝表示,對于原先已經做的內容和功能,可以繼續保留和使用,并且還可以繼續擴充,只不過前端的語義分析和業務邏輯處理都要交給靈聚人工大腦來統一協同處理,由人工大腦決定內容是指向本地的還是靈聚智能的云,這樣才能確保更完美效果。
張勝進一步表示,在下個月的世界機器人大會期間,他們將會發布靈聚人工大腦 4.0——擺脫了過去單一問答式的人機互動模式,還具備一定的思維能力。對于靈聚來說,這是一個具有里程碑意義的版本,也將成為靈聚人工大腦步入強人工智能領域的奠基之作。
務實、清晰的布局思路、技術落地且具備盈利的可能性才是硬道理
2016 年 8 月,靈聚已完成 A 輪融資,據了解,這筆資金將主要用于加強靈聚的研發、市場和生態鏈建設和布局。
「每當我們取得技術突破,解決了一些問題之后,發現等待解決的問題不是變少了,而是有更多的問題需要解決。接下來,我們一方面將現有的成熟技術落地,為更多的方案商和研發者提供技術服務,支持更多性價比好的智能產品上市;技術方面,將主要在深度學習、機器思維能力和情感能力方面做更多的研究,并且將不斷完善應用場景和方案?!箯垊僬f道。
「多年的媒體工作也讓我增長了不少見識,許多創業者并沒有在艱難的起步階段倒下,而是在獲得第一筆大額投資的時候,把持不住內心的狂野和欲望,倒在了利益失衡、盲目投資與擴張的路上。在創業的道路上,創業者難免會面臨各種問題和風險,實在不易?!?/p>
張勝還說道,投資人和被投資人之間還真的需要「緣分」,能理解和看好你的,即便你很坦誠的講述自己所面臨的各種問題,他也會從正面積極的角度去理解;反之,一些投資人會讓你拿出各種證明來證明技術、產品有市場、商業模式等,在有些情況下,你越是急于證明,他們反而越懷疑。
被投資人是否務實,團隊是否具有核心競爭力,公司穩定并且有發展的持續性,技術迭代的連續性和前瞻性、清晰的布局思路,這些都是投資人主要看重的方面。但更重要的是,技術已經落地并且具備了清晰的盈利模式和盈利的可能性。
● ● ●
本期「連線灣星人」將邀請到靈聚科技的創始人張勝一起,聊聊人工大腦未來的發展前景和技術方向。
點擊此處或長按圖片中的二維碼,參與 9 月 8 日(周四)晚上的「連線灣星人」在線活動,與張勝做進一步交流。
