產經 > 科技

中科院自動化所發佈通用AI平臺 可實現圖文音"無縫轉換"

新華社,北京
2021-07-12 14:22

已收藏



新華社北京7月12日電(記者董瑞豐)從檢索圖像、描述視頻,到吟詩作賦、續寫文章,再到識別語音、雙語翻譯,虛擬人"小初"日前亮相2021世界人工智慧大會,展示了圖、文、音三種模態的智慧轉換和生成。

"小初"具備這樣的能力,得益於一個名為"紫東太初"的跨模態通用人工智慧平臺。該平臺由中國科學院自動化研究所研發,基於國產化基礎軟硬體,僅採用一個大模型,即可"鍛煉"人工智慧在視覺、文本、語音多個場景的理解能力。

中科院自動化所所長徐波介紹,"大資料+大模型+多模態"將改變當前單一模型對應單一任務的人工智慧研發範式,多模態大模型將成為不同領域的共性平臺技術,是邁向通用人工智慧的重要路徑探索。

"`紫東太初`實現了圖、文、音三種模態的統一表達,以圖生音,以音生圖,將開拓AI在視頻配音、語音播報、標題摘要、海報創作等更多元場景的應用。"徐波說。

據瞭解,中科院自動化所構建了中文預訓練模型、語音預訓練模型、視覺預訓練模型,並通過跨模態語義關聯,構建了三模態預訓練大模型。
評論區

最新評論

最新新聞
點擊排行