產經 > 科技

新研究:新技術助力人工智慧減少＂胡謅＂

新華社，北京

2024-06-25 16:00

已收藏

新華社北京6月25日電人工智慧(AI)中廣泛使用的大語言模型不時出現的"一本正經地胡謅"是其難以克服的問題。近日，英國牛津大學研究團隊開發出一種名為"語義熵"的新方法，有望大幅提升AI回答的可靠性。

大語言模型的"胡謅"在業界被稱為"幻覺"，牛津大學電腦科學系的研究人員提出"語義熵"方法試圖解決這一問題。在熱力學中，熵描述的是系統的混亂或者說不穩定程度。這項研究中，熵衡量了大語言模型回答的不確定性，不確定性高意味著大語言模型的回答可能存在虛構。

該研究成果已發表在近期出版的英國《自然》雜誌上。論文中說，如果AI對同一個問題，給出了許多語義相似的答案，那說明它對自己的回答比較有把握；反之，如果答案五花八門，那就意味著AI自己也"心裡沒底"，很可能是在"胡謅"。

研究人員利用"語義熵"方法，讓大語言模型對同一問題生成多個答案，然後將語義相近的答案聚類，最後根據聚類結果計算熵值。熵值越高，表示大語言模型的回答越不確定。

值得注意的是，這一方法不僅考慮了大語言模型回答的字面差異，更關注語義層面的一致性。這使得"語義熵"能夠更準確地識別AI的"胡謅"，而不會被表達方式的多樣性所迷惑。

研究結果表明，"語義熵"方法在多個資料集和任務中都表現出色，能有效檢測大語言模型的錯誤回答，並通過拒絕回答不確定的問題來提高整體準確率。更重要的是，這一方法無需修改AI模型本身，可以直接應用于現有的大語言模型。

研究人員說，"語義熵"技術有望在問答系統、文本生成、機器翻譯等多個領域發揮重要作用，幫助AI生成更可靠、更有價值的內容。這不僅將提升AI在實際應用中的表現，也將增強使用者對AI系統的信任。

本網站的所有金融數據和信息乃為一般性質，僅作為一般資料來源，不構成任何投資決定的意見或建議。本網站的觀點代表新華財金社發布時的意見，且可能更改。新華財金社將做出合理努力，保證其網站內容准確即時，但新華財金社對其准確性、適當性和完整性概不發表任何保證或聲明，概不就因訪問、使用或未能使用新華財金社網站或因其內容的任何錯誤或遺漏而產生的任何直接、偶然、必然、間接或懲罰性損失承擔任何責任。

會員登錄

新研究:新技術助力人工智慧減少＂胡謅＂

Copyright © 2015 - Xinhua Finance Agency Ltd. All rights reserved.
如果使用IE瀏覽器，請使用IE10或以上版本訪問本網站。

會員登錄

新研究:新技術助力人工智慧減少＂胡謅＂

today=new Date() theYear = today.getYear() if(theYear >= 100 && theYear < 2000) theYear=theYear-100+2000 Copyright © 2015 - document.write(theYear); Xinhua Finance Agency Ltd. All rights reserved.如果使用IE瀏覽器，請使用IE10或以上版本訪問本網站。

Copyright © 2015 - Xinhua Finance Agency Ltd. All rights reserved.
如果使用IE瀏覽器，請使用IE10或以上版本訪問本網站。