產經 > 科技

中科院自動化所發佈通用AI平臺可實現圖文音＂無縫轉換＂

新華社，北京

2021-07-12 14:22

已收藏

新華社北京7月12日電(記者董瑞豐)從檢索圖像、描述視頻，到吟詩作賦、續寫文章，再到識別語音、雙語翻譯，虛擬人"小初"日前亮相2021世界人工智慧大會，展示了圖、文、音三種模態的智慧轉換和生成。

"小初"具備這樣的能力，得益於一個名為"紫東太初"的跨模態通用人工智慧平臺。該平臺由中國科學院自動化研究所研發，基於國產化基礎軟硬體，僅採用一個大模型，即可"鍛煉"人工智慧在視覺、文本、語音多個場景的理解能力。

中科院自動化所所長徐波介紹，"大資料+大模型+多模態"將改變當前單一模型對應單一任務的人工智慧研發範式，多模態大模型將成為不同領域的共性平臺技術，是邁向通用人工智慧的重要路徑探索。

"`紫東太初`實現了圖、文、音三種模態的統一表達，以圖生音，以音生圖，將開拓AI在視頻配音、語音播報、標題摘要、海報創作等更多元場景的應用。"徐波說。

據瞭解，中科院自動化所構建了中文預訓練模型、語音預訓練模型、視覺預訓練模型，並通過跨模態語義關聯，構建了三模態預訓練大模型。

本網站的所有金融數據和信息乃為一般性質，僅作為一般資料來源，不構成任何投資決定的意見或建議。本網站的觀點代表新華財金社發布時的意見，且可能更改。新華財金社將做出合理努力，保證其網站內容准確即時，但新華財金社對其准確性、適當性和完整性概不發表任何保證或聲明，概不就因訪問、使用或未能使用新華財金社網站或因其內容的任何錯誤或遺漏而產生的任何直接、偶然、必然、間接或懲罰性損失承擔任何責任。

會員登錄

中科院自動化所發佈通用AI平臺可實現圖文音＂無縫轉換＂

Copyright © 2015 - Xinhua Finance Agency Ltd. All rights reserved.
如果使用IE瀏覽器，請使用IE10或以上版本訪問本網站。

會員登錄

中科院自動化所發佈通用AI平臺 可實現圖文音＂無縫轉換＂

today=new Date() theYear = today.getYear() if(theYear >= 100 && theYear < 2000) theYear=theYear-100+2000 Copyright © 2015 - document.write(theYear); Xinhua Finance Agency Ltd. All rights reserved.如果使用IE瀏覽器，請使用IE10或以上版本訪問本網站。

中科院自動化所發佈通用AI平臺可實現圖文音＂無縫轉換＂

Copyright © 2015 - Xinhua Finance Agency Ltd. All rights reserved.
如果使用IE瀏覽器，請使用IE10或以上版本訪問本網站。