產經 > 科技

柯潔與AlphaGo五月對決 機器人有多強大?

中国证券网
2017-04-11 10:57

已收藏

“AlphaGo採用的是蒙特卡羅樹搜索框架,加上深度學習和深度強化學習。在這樣一個框架下,深度學習尤其是深度強化學習在電腦圍棋上的天花板究竟有多高,還是個未知數。”中國人工智慧學會副理事長、清華大學電腦系教授馬少平指出。

就仿佛科幻小說《三體》中,人類艦隊首次迎戰三體艦隊“水滴”——去年3月,AlphaGo與李世石的圍棋對決,讓原本自信的人類,被不可預料的強大戰鬥力打了個措手不及。而與《三體》中人類艦隊幾乎全軍覆沒、殘存艦隊倉皇逃走所不同的是,李世石版人機大戰還留下了一個懸念:人類圍棋第一人柯潔,與AlphaGo戰果如何?

如今,這個懸念將在今年5月于烏鎮揭曉。

4月10日,中國圍棋協會、浙江省體育局及穀歌共同宣佈,三方將於5月23日至27日聯合主辦“中國烏鎮·圍棋峰會”(以下簡稱“圍棋峰會”)。圍棋峰會首日,柯潔與AlphaGo升級版的比賽將正式開打。該次比賽將採用中國規則的三番棋賽制,無論輸贏均下滿3盤,比賽每方3小時,5次1分鐘讀秒。

除此之外,主辦方表示,圍棋峰會期間還將舉辦配對賽和團隊賽。在配對賽中,兩位棋手將分別與AlphaGo組隊,以此挑戰棋手如何理解AlphaGo的獨特風格並與之合作;在團隊賽中,將由五位中國頂尖棋手合作,建立棋手“神經網路”與AlphaGo對決。

“我在半年前得知了與AlphaGo對決的消息,這次能夠與AlphaGo對決,是我的榮幸。”在10日發佈會現場,柯潔如是坦言。而對於一個“只有勝利才是唯一真諦”的棋手而言,柯潔表示“這一次不會輕易妥協”,並稱“抱有必勝的心態和必死的信念”。

來自未來的對手

本次發佈會就如AlphaGo一般神秘。在發佈會前夕,穀歌僅對外通知10日下午將有“重磅消息”,直到10日上午9點之前,發佈會地點仍是一個謎團。

即便如此神秘,也難掩內容本身的耀眼。早在數日之前,發佈會的內容便不脛而走:業內傳聞AlphaGo將與柯潔有一戰,戰期定檔在5月下旬的烏鎮。在10日發佈會現場,主辦方宣佈這個巔峰對決的時間為5月23日。

賽事如此吸引眼球,原因在於這次的交戰雙方。

作為當今棋壇第一人,柯潔更像是人類獲勝的最後一絲希望。他曾在一年前李世石0:2落後於AlphaGo之際放出豪言:AlphaGo要證明自己天下無敵,必須先過自己這一關,並稱自己有信心戰勝對手,“勝算大概在六七成”。

如今,在圍棋峰會發佈會現場,柯潔則顯得更為謙虛,將AlphaGo描述為來自未來的對手。“現在的AlphaGo已經超過我們最強棋手的想像,帶給我們最大的震撼與享受,”柯潔感慨道,“我是站在了歷史變革的節點之上,很幸運能夠見證AlphaGo這樣強大的棋手。”

作為人工智慧代表,全新版本AlphaGo相較一年之前更加強大,這也成為本次賽事的另一大看點。據介紹,新版AlphaGo採用了新的機器學習技術,能夠通過訓練形成策略網路,將棋盤上的局勢作為輸入資訊,並對所有可行的落子位置生成概率分佈,然後訓練出價值網路進行預測,以對手的絕對勝利到AlphaGo的絕對勝利為標準,預測所有可行落子位置的結果。

而AlphaGo的真正優勢體現在,將策略網路和價值網路整合進基於概率的蒙特卡羅樹搜索(MCTS)中,將監督學習和強化學習結合起來。此外,新版AlphaGo還將產生大量自我對弈棋局,通過自身為下一版本提供訓練資料。

“蒙特卡羅樹搜索的演算法是讓AlphaGo不停地自我對弈,”一位業內觀察人士表示,“通過自我對弈,進而訓練價值網路和策略網路,從而優化蒙特卡羅樹搜索。”

換言之,擊敗李世石的AlphaGo 1.0,是通過學習大量人類對戰棋譜及與多位人類頂級高手交鋒,不斷積累形成棋力的。本次迎戰的AlphaGo 2.0版本,則將完全摒棄人類棋譜,憑藉自我對弈成長為頂級高手。

不過,儘管柯潔自己坦言AlphaGo為強勁對手,卻仍表示不會輕易妥協。“無論它多麼強大,我都要一決勝負,並盡力擊敗AlphaGo,”柯潔稱,“現在我的心情很激動,期待五月的大戰。”

勝負之外

儘管還未開戰,但外界對本次賽事的結果,已經開始有了預期。

“AlphaGo採用的是蒙特卡羅樹搜索框架,加上深度學習和深度強化學習。在這樣一個框架下,深度學習尤其是深度強化學習在電腦圍棋上的天花板究竟有多高,還是個未知數。”中國人工智慧學會副理事長、清華大學電腦系教授馬少平指出。

而就是這樣尚看不清天花板的人工智慧應用,已經足以橫掃人類頂級高手。一年以來,由AlphaGo引爆的各色棋牌類人機大戰的結果已基本沒有任何懸念:無論是AlphaGo化身Master,在網上實現對陣各國高手,實現60連勝(其中亦包括柯潔),還是騰訊絕藝在騰訊野狐平臺率先晉升網路十段,此後在第10屆UEC杯中稱王,或是新近落幕的德州撲克人機對決中,卡內基梅隆大學開發的“冷撲大師AI”毫無懸念地戰勝中國龍之隊……在棋牌類人機大戰中,人類已越來越心平氣和地接受了自己的落敗。

“AlphaGo與人類的對決已持續了很長時間,機器人確實很強大。比賽的勝負很重要,柯潔也表示將竭盡全力比賽並爭取勝利,”圍繞此次對決,國家體育總局棋牌運動管理中心主任羅超毅指出,“柯潔沒有與AlphaGo進行慢棋比賽,現在誰輸誰贏還沒有落定。”

事實上,在年初Master的網路對局中,它採用的都是“20秒3次”的超快棋方式,幾乎都是在中盤輕易取勝,然而在去年李世石對陣AlphaGo時採用的是慢棋,最終有一盤取勝。而在本次圍棋峰會中,無論是柯潔與AlphaGo的“單挑”,還是頂級棋手組成“神經網路”與AlphaGo“車輪戰”,都延長了行棋的時間,無形中對人類或將更加有利。

此外,羅超毅強調,勝負固然重要,卻並非本次圍棋峰會的全部,也不是峰會的主題。“柯潔與AlphaGo的對決,不僅僅是人機對戰,而是科學家與棋手的智慧交流。”羅超毅指出,“柯潔曾提到,AlphaGo的許多招法是過去所沒有想過的,這也恰好證明了圍棋奇妙無窮,提升的空間很大,無論棋手還是深度學習團隊,都將從中獲益匪淺。”
評論區

最新評論

最新新聞
點擊排行