新棋王「AlphaZero」完勝「AlphaGo」也勝過自己

2017/12/13

「AlphaZero」完勝，擊敗了「AlphaGo」。(圖片擷取自YouTube)

研發出「AlphaGo」的Google Deepmind團隊，再次展現超高人工智慧的技術，在最新發表的一篇論文中提出了一種全新強化學習的演算方法「AlphaZero」，不僅擊敗了歷來的「AlphaGo」，在不到50天的時間裡，更再度超越自我。

去(2016)年，「AlphaGo」不僅擊敗了頂尖的職業棋士李世乭，更在今年的五月間，打敗中國大陸棋王柯潔，之後便再也沒有人類對手，隨後宣布退役。然而，Google Deepmind團隊在圍棋上的探索並未因此停止。今年10月間該團隊推出從「零」開始自學的「AlphaZero」，不僅完勝擊敗了「AlphaGo」；在不到50天的時間，團隊再度發表論文，發表了再度超越自我的通用棋類人工智慧程式「AlphaZero」。

論文中顯示，「AlphaZero」從零開始學習，除了僅有的基本規則外，完全沒有任何的其他知識，2小時便擊敗了最強的將棋人工智慧程式「Elmo」，4個小時的時間，擊敗了最強的國際象棋人工智慧程式「Stockfish」；8小時便可擊敗曾經擊敗李世乭的初代「AlphaGo」；最後在34小時的訓練後，也勝過了一開始訓練72小時的「AlphaZero」。

Google Deepmind團隊最終希望能夠利用「AlphaZero」的運算法來解決重大的醫療問題。團隊相信，在人類數百年來都無法研發出的重大疾病療法，藉由該程式或許能在數日或是數周內研發出來。【記者鄒弘整理報導】

環科

搜尋表單

新棋王「AlphaZero」完勝「AlphaGo」 也勝過自己

更多國際新聞

新棋王「AlphaZero」完勝「AlphaGo」也勝過自己