產經 > 科技

中國人工智慧團隊開發藏語方言語音辨識新技術

新華社,成都
2022-03-24 08:45

已收藏



新華社成都3月24日電(記者康錦謙)一支平均年齡僅為26歲的年輕團隊,經過數年時間技術攻關,在近日通過一款輸入法軟體實現衛藏、安多和康巴三大藏語方言的混合精准識別,解決了困擾深牧區藏族群眾前往城市交流的難題。

這群年輕人來自科大訊飛四川公司,他們開發的軟體叫"東噶藏文輸入法"。產品經理尼瑪旺堆是一名畢業于西南民族大學的"95後",他既精通藏語、漢語,又在工作以後自學了人工智慧技術。

尼瑪旺堆告訴記者,依託三大藏語方言強大的語料庫,新上線的"東噶藏文輸入法"在智慧語音辨識和轉寫技術的基礎上,開發了藏文急速語音輸入和手寫辨識輸入功能。

據瞭解,藏語有衛藏、安多和康巴三大方言,使用不同方言的藏族群眾在日常口語交流中不完全相通。尤其對居住在偏遠牧區的藏族群眾來說,前往城市就醫、經商、旅行,語言是一大難題。

"實現三大方言混合識別後,預計可滿足全國三分之二藏族群眾的使用需求。"尼瑪旺堆說,"東噶"為藏語白海螺的音譯,在藏族文化中,白海螺屬於"吉祥八寶"之一,他們希望這款軟體能為人們的交流帶去便捷與吉祥。

早在2017年,"東噶藏文輸入法"便已上線投用,但搜集康巴語語料庫和實現藏語語音辨識輸入這條路,耗費了團隊近5年的時間。

"研究最大的困難有兩個,一是沒有資料,二是小語種缺少語言專家的支援。"尼瑪旺堆說。

為了解決難題,科大訊飛研究團隊多管道拓展發音人,還在西南民族大學找了近60名藏族學生,不斷豐富康巴語的語料搜集。另一方面,團隊成立緊急研究攻關小組,研發了一套通用性強的新一代端到端多語種語音合成系統。

來自新疆的軟體發展工程師曹斌,大學學的是語言學。他告訴記者,藏語和漢語在語法結構上有許多不同,比如3月13日,在藏語中是13日3月,"若干條"在藏語中是"條若干",面對這樣的問題,他們需要考慮藏文和漢文版本的展示效果。

另一方面,視覺設計工程師還要考慮藏語和漢語的詞句長度問題。鄧琪告訴記者,作為團隊的UI設計師,有時為了追求美觀,想讓兩語種對稱,對翻譯句子進行縮減或增長,但又擔心翻譯不準確,因此不停地進行嘗試,和同事不斷交流溝通,力求達到完美效果。

尼瑪旺堆告訴記者,軟體上線後,經常有用戶找來表達感謝。記者在手機截圖中看到,一位名叫普布倉決的用戶說他母親年紀大了,就只會說藏語,打字方面有困難,這款軟體能自動識別藏語,媽媽使用後評價非常棒。還有使用者表示這款軟體對自己學習很有幫助。一些熱心使用者還會對軟體更新提出建議,説明團隊改進。

據悉,截至目前,東噶藏文輸入法累計用戶數超過480萬,覆蓋西藏、四川、青海等地。尼瑪旺堆說,他相信語言這座溝通的橋樑,不只是一種交流工具,還能拉近不同地方人們的心。
評論區

最新評論

最新新聞
點擊排行