您現(xiàn)在的位置:海峽網(wǎng)>新聞中心>IT科技>科技前沿
分享

人說話時嘴唇動作跟語音同步,可以通過識別唇動信息進(jìn)行語言信息交流。唇語對講話者友好,但是對解讀唇語的聽眾來說卻并不輕松,唇語解讀一直以來是個難題,掌握唇語解讀技能的成本較高。

據(jù)了解,為降低唇語解讀難度,現(xiàn)有技術(shù)手段常采用磁場、視覺圖像、超聲波等方法。以最流行的非接觸式視覺圖像方法為例,其唇語識別準(zhǔn)確率較高,但依然容易受到面部角度、光強(qiáng)、頭動和遮擋等因素干擾。特別是在此次新冠病毒流行期間,佩戴的口罩給基于視覺的唇動解讀帶來全新挑戰(zhàn)。因此,通過直接捕捉面部肌肉細(xì)微動作解讀唇語技術(shù)具有重要的科學(xué)研究價值與廣闊的應(yīng)用前景。

如果在不久的將來,嘴唇掀動——“開門”,也許電子門禁能秒懂,馬上識別身份并解鎖;與汽車對話——“左拐”,或許可控制車的方向逐漸向目標(biāo)移動;對于聲帶、喉舌損傷的失聲人群,唇語可能將是一種不占用雙手的、日常無障礙交流的有效方式……

這些想法,在近日清華大學(xué)機(jī)械工程系智能與生物機(jī)械團(tuán)隊(duì)推出一種新穎的唇語解讀系統(tǒng)之后,將很有可能夢想成真。相關(guān)研究成果發(fā)表在最新的《自然·通訊》期刊上。

據(jù)了解,這項(xiàng)技術(shù)的主要試驗(yàn)和測試工作由清華機(jī)械工程系智能與生物機(jī)械實(shí)驗(yàn)室完成,中科院納米能源與系統(tǒng)研究所的王中林院士對整個科研工作過程進(jìn)行建議和指導(dǎo)。

那么,究竟這項(xiàng)唇語解讀系統(tǒng)的新穎之處何在?“這個基于深度學(xué)習(xí)輔助自供電柔性傳感器的唇語解讀技術(shù),目標(biāo)是解決聲帶、喉舌損傷失聲人群的日常無障礙交流問題,其不占用雙手,不受面部角度、光強(qiáng)、遮擋和頭動等外部因素的干擾,新穎之處在于開發(fā)自供電的柔性傳感器(靈敏度0.61183 V/kPa)采集肌肉的微小動作信號,并采用基于原型學(xué)習(xí)的深度學(xué)習(xí)模型,使用較少的數(shù)據(jù)訓(xùn)練,測試準(zhǔn)確率可達(dá)94.5%,實(shí)現(xiàn)即時捕捉失聲人群的唇動并轉(zhuǎn)譯成語音,可用于失聲人群的日常無障礙語音交流。”3月29日,該論文第一作者、清華大學(xué)機(jī)械工程系智能與生物機(jī)械團(tuán)隊(duì)助理研究員路益嘉在接受科技日報(bào)記者采訪時表示。

這個唇語解讀系統(tǒng)是否會運(yùn)用大數(shù)據(jù)、人工智能等技術(shù),突破的技術(shù)瓶頸是什么?路益嘉答道,“實(shí)現(xiàn)對唇動信號的識別需要用到人工智能技術(shù)和機(jī)器學(xué)習(xí)算法。在實(shí)際測試中發(fā)現(xiàn),由于不同人的面部骨骼肌肉、肌肉運(yùn)動形式、肌肉動作先后順序和習(xí)慣語速等存在不同,即使是同一個詞和同一句話,采集到的信號也有區(qū)別,為了得到通用的可以接受的測試準(zhǔn)確率,需要采集海量的數(shù)據(jù)進(jìn)行模型訓(xùn)練。然而,這樣的成本偏高。”

據(jù)介紹,研究人員沒有采用訓(xùn)練通用模型的技術(shù)路線,而是采用訓(xùn)練個性化的小樣本量數(shù)據(jù)模型的方法,即對每個人的每個詞(或每句話)分別采集小樣本量(相對海量數(shù)據(jù)而言)的數(shù)據(jù)進(jìn)行模型訓(xùn)練,考慮到每人說話的唇動都具有獨(dú)特的習(xí)慣特征,這樣訓(xùn)練出的模型缺少通用性但更有針對性,而不考慮通用性的要求降低模型對訓(xùn)練數(shù)據(jù)量的需求,小樣本量也能得到可接受的測試準(zhǔn)確率。研究人員使用基于原型學(xué)習(xí)的空洞循環(huán)神經(jīng)網(wǎng)絡(luò),來減少模型對訓(xùn)練樣本量的需求。例如,在測試中對20個常用水果名稱的唇動信號進(jìn)行分類訓(xùn)練,每個水果名稱的唇動信號選取100個樣本,測試準(zhǔn)確率達(dá)94.5%。

這項(xiàng)研究將在哪些領(lǐng)域應(yīng)用,發(fā)揮作用?“該研究通過自供電傳感器采集唇動微動信號,并使用深度學(xué)習(xí)模型將信號識別為有含義的語音信號或文字信號,比較適合服務(wù)失聲人群,在日常生活交流中可恢復(fù)失聲人群的基本語音交流能力,并保留失聲前的說話習(xí)慣。”路益嘉表示。

此外,其還可應(yīng)用于個人身份識別。研究人員制作出一個唇動指令開門的應(yīng)用演示。由于該方法融合特定密碼口令的靜態(tài)特征和個人特殊的唇部動態(tài)特征,可以實(shí)現(xiàn)雙重特征驗(yàn)證,特別是戴口罩不發(fā)聲說密碼的方式可進(jìn)一步提升系統(tǒng)安全性,適用于安全驗(yàn)證要求較高的場合。

該研究成果還可用于人機(jī)交互的研究。研究人員制作出一個唇動信號控制模型車運(yùn)動方向的應(yīng)用演示,通過檢測唇動發(fā)出的方向指令,機(jī)器模型車可改變行進(jìn)方向。這為現(xiàn)有人機(jī)交互方案提供了新的可能性。

責(zé)任編輯:莊婷婷

       特別聲明:本網(wǎng)登載內(nèi)容出于更直觀傳遞信息之目的。該內(nèi)容版權(quán)歸原作者所有,并不代表本網(wǎng)贊同其觀點(diǎn)和對其真實(shí)性負(fù)責(zé)。如該內(nèi)容涉及任何第三方合法權(quán)利,請及時與ts@hxnews.com聯(lián)系或者請點(diǎn)擊右側(cè)投訴按鈕,我們會及時反饋并處理完畢。

最新科技前沿 頻道推薦
進(jìn)入新聞頻道新聞推薦
【盛世蓮開】習(xí)言道|澳門是偉大祖國的
進(jìn)入圖片頻道最新圖文
進(jìn)入視頻頻道最新視頻
一周熱點(diǎn)新聞
下載海湃客戶端
關(guān)注海峽網(wǎng)微信
?

職業(yè)道德監(jiān)督、違法和不良信息舉報(bào)電話:0591-87095414 舉報(bào)郵箱:service@hxnews.com

本站游戲頻道作品版權(quán)歸作者所有,如果侵犯了您的版權(quán),請聯(lián)系我們,本站將在3個工作日內(nèi)刪除。

溫馨提示:抵制不良游戲,拒絕盜版游戲,注意自我保護(hù),謹(jǐn)防受騙上當(dāng),適度游戲益腦,沉迷游戲傷身,合理安排時間,享受健康生活。

CopyRight ?2016 海峽網(wǎng)(福建日報(bào)主管主辦) 版權(quán)所有 閩ICP備15008128號-2 閩互聯(lián)網(wǎng)新聞信息服務(wù)備案編號:20070802號

福建日報(bào)報(bào)業(yè)集團(tuán)擁有海峽都市報(bào)(海峽網(wǎng))采編人員所創(chuàng)作作品之版權(quán),未經(jīng)報(bào)業(yè)集團(tuán)書面授權(quán),不得轉(zhuǎn)載、摘編或以其他方式使用和傳播。

版權(quán)說明| 海峽網(wǎng)全媒體廣告價| 聯(lián)系我們| 法律顧問| 舉報(bào)投訴| 海峽網(wǎng)跟帖評論自律管理承諾書

友情鏈接:新聞頻道?| 福建頻道?| 新聞聚合