AlphaGo是2014年由谷歌旗下的DeepMind公司開發(fā)的一款人工智能圍棋程序。它使用深度學(xué)習(xí)等技術(shù),在完全自主學(xué)習(xí)的情況下實(shí)現(xiàn)對(duì)弈水平的逐步提升,并且在后續(xù)的博弈中,戰(zhàn)績卓著,影響巨大,成為“人工智能”的代名詞。
在深度了解AlphaGo之前,我們先來回顧一下歷史上的人機(jī)對(duì)弈大戰(zhàn)。
19世紀(jì)90年代末,隨著計(jì)算機(jī)技術(shù)的發(fā)展,人機(jī)對(duì)弈程序已初露端倪。

1997年,IBM的“深藍(lán)”電腦擊敗俄籍國際象棋冠軍加里·卡斯帕羅夫。

加里·卡斯帕羅夫
深藍(lán)計(jì)算機(jī)是由IBM開發(fā)的象棋電腦,歷史上第一個(gè)成功在標(biāo)準(zhǔn)國際象棋比賽中打敗衛(wèi)冕世界冠軍的計(jì)算機(jī)系統(tǒng)。
2012年,Zen圍棋程序在讓5子和讓4子的情況下,兩次擊敗日本九段棋手武宮正樹。
2014年,CrazyStone在讓4子的情況下,擊敗日本九段棋手石田芳夫。

2014年,單機(jī)版AlphaGo在和CrazyStone以及Zen等程序的500局對(duì)戰(zhàn)中僅輸一局。

2015年10月,AlphaGo以5:0擊敗歐洲圍棋冠軍樊麾。

AlphaGo與歐洲圍棋冠軍樊麾的5局較量
2016年3月,AlphaGo以4:1的成績戰(zhàn)勝世界圍棋冠軍、職業(yè)九段選手李世石。

2016年12月,AlphaGo以Master的網(wǎng)名,在各大圍棋對(duì)戰(zhàn)平臺(tái),橫掃眾多世界級(jí)冠軍。

2017年5月,AlphaGo與排名世界第一的世界圍棋冠軍柯潔對(duì)戰(zhàn),以3:0的總比分獲勝。

圍棋界公認(rèn)AlphaGo的棋力已經(jīng)超過人類職業(yè)圍棋頂尖水平,在GoRatings網(wǎng)站公布的世界職業(yè)圍棋排名中,其等級(jí)分曾超過排名人類第一的棋手柯潔。

AlphaGo為何能在人機(jī)對(duì)弈和機(jī)器對(duì)弈中獨(dú)占鰲頭?
這歸功于包括蒙特卡洛樹搜索、估值網(wǎng)絡(luò)、策略網(wǎng)絡(luò)等技術(shù)的融合運(yùn)用。其中,后兩者是一種多層CNN神經(jīng)網(wǎng)絡(luò)模型。得益于深度學(xué)習(xí)理論的發(fā)展,AlphaGo獲得了更強(qiáng)的智能和不斷的進(jìn)步。