AI 攝影機(jī)、人臉識(shí)別一體機(jī)、優(yōu)圖盒子,騰訊優(yōu)圖聯(lián)合英特爾推出多款硬件

騰訊優(yōu)圖發(fā)布手語翻譯機(jī),視覺 AI 應(yīng)用又上新
科技向善,助力信息無障礙建設(shè)!
深圳灣現(xiàn)場(chǎng)報(bào)道,在 5 月 21-23 日 召開的 2019 騰訊全球數(shù)字生態(tài)大會(huì)上,騰訊優(yōu)圖實(shí)驗(yàn)室推出了基于自研算法的「優(yōu)圖 AI 手語翻譯機(jī)」。
產(chǎn)品以普通攝像頭作為手語采集裝置,依托高性能計(jì)算機(jī)進(jìn)行后臺(tái)運(yùn)算,用戶只要正對(duì)攝像頭完成手語表達(dá),翻譯機(jī)就能快速運(yùn)算出結(jié)果,并把手語翻譯成為文字。
手語識(shí)別背后的視覺 AI 技術(shù)
手語識(shí)別(SLR),指通過計(jì)算機(jī)算法,自動(dòng)區(qū)分手語表達(dá)中的各類手勢(shì)、動(dòng)作以及這些手勢(shì)和動(dòng)作之間的切換,最后將表達(dá)的手語翻譯成文字。相比于其他 AI 視覺識(shí)別技術(shù)的研究,手語識(shí)別的研發(fā)存在更大的困難和挑戰(zhàn)。手語表達(dá)所特有的地域性、復(fù)雜性和多樣性,極大地增加了數(shù)據(jù)采集與清洗的難度和成本。同時(shí),受限于數(shù)據(jù)量的大小和人工設(shè)計(jì)特征的缺陷,很多傳統(tǒng)研究的研究方法在適應(yīng)性、泛化性、及魯棒性上,都十分有限。
騰訊優(yōu)圖結(jié)合聽障人士手語表達(dá)的習(xí)慣,采集手語數(shù)據(jù),參考手勢(shì)識(shí)別、動(dòng)作識(shí)別、序列翻譯等技術(shù),通過自研算法,實(shí)現(xiàn)了對(duì)復(fù)雜手語表達(dá)的識(shí)別技術(shù)突破。相較于其他方法,優(yōu)圖 AI 手語翻譯機(jī)的數(shù)據(jù)集覆蓋了近 1000 句日常表達(dá),900 個(gè)常用詞匯,同時(shí)對(duì)數(shù)據(jù)進(jìn)行進(jìn)一步的分析和歸納,擁有目前最大的中文手語識(shí)別數(shù)據(jù)集,并支持整句手語表達(dá)的識(shí)別,可直接判斷用戶是否結(jié)束并完成實(shí)時(shí)翻譯。
視覺 AI 助力信息無障礙建設(shè)
據(jù)北京聽力協(xié)會(huì) 2017 年公開數(shù)據(jù),中國(guó)殘疾性聽力障礙人士已達(dá) 7200 萬,相當(dāng)于北京市常住人口(約 2200 萬,2015 年數(shù)據(jù))的 3 倍多。盡管我國(guó)在信息無障礙領(lǐng)域的投入逐漸增加,但目前國(guó)內(nèi)的聽障人群需求依然得不到滿足。
優(yōu)圖 AI 手語翻譯機(jī)的推出,將一定程度地緩解聽障人士的交流障礙。未來,優(yōu)圖實(shí)驗(yàn)室將嘗試在日常服務(wù)窗口、手語教育等公共場(chǎng)景中,逐步將 AI 手語翻譯機(jī)落地,為聽障人士帶來實(shí)實(shí)在在的便利。

目前,優(yōu)圖實(shí)驗(yàn)室已經(jīng)和深圳市信息無障礙研究會(huì)成立 AI 手語識(shí)別聯(lián)合項(xiàng)目組,就手語數(shù)據(jù)采集、產(chǎn)品算法優(yōu)化等方面展開長(zhǎng)期深度合作。
騰訊在信息無障礙方面的探索已有十年,目前,旗下 QQ、QQ 空間、微信、騰訊網(wǎng)、騰訊新聞、應(yīng)用寶、企鵝 FM 等大部分產(chǎn)品,均已針對(duì)障礙用戶實(shí)現(xiàn)專門優(yōu)化。而騰訊優(yōu)圖團(tuán)隊(duì)則在 2013 年,與手機(jī) QQ 一起打磨了 OCR 引擎技術(shù),可將圖片上的文字直接轉(zhuǎn)換為可編輯的結(jié)構(gòu)化文本,幫助視障群體實(shí)現(xiàn)信息溝通無障礙化。
編輯:森林木 / 深圳灣