英國東英吉利大學日前發佈的新成果顯示,該校研究人員開發的新型視覺語音辨識系統能像專業人員那樣識別唇語,且識別度更精確,未來在案件偵查以及輔助聽力和語言有障礙的人士方面具有廣泛用途。
據研究人員介紹,無論是專業人士還是現有的視覺語音電腦識別系統,在讀唇語時一個最大挑戰是如何區別容易混淆的發音,如英文中"p"、"b"、"m"發音時,唇部動作都非常相似,很難區別。但最新開發的電腦系統利用特別設計的程式,能分辨出圖像中唇部最細微的變化,並且完全不需要語音資訊輔助。
參與這項研究的東英吉利大學學者海倫·貝爾說,發"p"、"b"、"m"這樣的音時,唇部動作還是會有肉眼不易察覺的差別,這款電腦程式會不斷學習和積累相似發音的唇部動作,並進行相關分類,從而不斷提高識別的精確度。
貝爾說,未來經過進一步優化,這一系統能夠運用在多個領域中,除了用來説明有聽力和語言障礙的人士,相關技術也會對人工智慧的發展起到很好的助推作用。
最新評論