研究顯示,通過在演算法中使用"演繹推理","深度角色"根據觀察到的部分行為,推斷某一玩家是敵是友,快速學習應該與誰結盟從而獲得勝利。
今年7月,美國卡內基-梅隆大學宣佈,人工智慧Pluribus在六人桌德州撲克比賽中擊敗多名世界頂尖選手,突破了人工智慧僅能在國際象棋和圍棋等二人遊戲中戰勝人類的局限。但在這些遊戲中,人工智慧從一開始就知道"誰是敵人、誰是朋友"。
研究人員讓"深度角色"參與了超過4000輪線上桌遊"抵抗組織:阿瓦隆"。"阿瓦隆"類似於"殺人遊戲"或"狼人殺",玩家通過遊戲進程推測出其他玩家的身份,同時掩藏自己的身份。結果顯示,不論作為"好人"還是"壞人","深度角色"都比人類玩家表現更加出色。
"深度角色"採取了一種被稱為"反事實遺憾最小化"的博弈演算法,利用"博弈樹"預測每個玩家的行為,並推斷出玩家角色的最大可能性。這種人工智慧程式在遊戲中進行自我對抗,逐步接近最佳策略,實現"至少與對手打平"的納什均衡。
"阿瓦隆"的人類玩家通常要在遊戲過程中通過對話為決策提供部分依據,而"深度角色"只觀察玩家行為,無需參與交流。研究人員未來計畫讓機器表達簡單的資訊,如玩家是敵是友等。
語言是人工智慧的下一個前沿,因為人類玩家會說謊,需要更複雜的交流技巧。只有掌握表達技巧後,人工智慧才能參與那些需要對其他玩家進行勸說的複雜社交推理遊戲。
研究人員說,這項工作可以更好模擬人類是如何做出社會決策的,從而幫助人工智慧更好理解人類、向人類學習並與人類共事。
最新評論