新棋王「AlphaZero」完勝「AlphaGo」 也勝過自己

研發出「AlphaGo」的Google Deepmind團隊,再次展現超高人工智慧的技術,在最新發表的一篇論文中提出了一種全新強化學習的演算方法「AlphaZero」,不僅擊敗了歷來的「AlphaGo」,在不到50天的時間裡,更再度超越自我。

去(2016)年,「AlphaGo」不僅擊敗了頂尖的職業棋士李世乭,更在今年的五月間,打敗中國大陸棋王柯潔,之後便再也沒有人類對手,隨後宣布退役。然而,Google Deepmind團隊在圍棋上的探索並未因此停止。今年10月間該團隊推出從「零」開始自學的「AlphaZero」,不僅完勝擊敗了「AlphaGo」;在不到50天的時間,團隊再度發表論文,發表了再度超越自我的通用棋類人工智慧程式「AlphaZero」。

論文中顯示,「AlphaZero」從零開始學習,除了僅有的基本規則外,完全沒有任何的其他知識,2小時便擊敗了最強的將棋人工智慧程式「Elmo」,4個小時的時間,擊敗了最強的國際象棋人工智慧程式「Stockfish」;8小時便可擊敗曾經擊敗李世乭的初代「AlphaGo」;最後在34小時的訓練後,也勝過了一開始訓練72小時的「AlphaZero」。

Google Deepmind團隊最終希望能夠利用「AlphaZero」的運算法來解決重大的醫療問題。團隊相信,在人類數百年來都無法研發出的重大疾病療法,藉由該程式或許能在數日或是數周內研發出來。【記者  鄒弘整理報導】