誰(shuí)也沒(méi)料到,2017年最先刷新人類(lèi)三觀的,竟然是人工智能。去年3月一戰(zhàn)成名的AlphaGo(阿爾法圍棋),在歲末年初化身為“Master”,進(jìn)行60場(chǎng)互聯(lián)網(wǎng)棋局車(chē)輪大戰(zhàn),挑落了幾乎所有的中日韓三國(guó)圍棋界泰斗名宿與天才新秀。

隨后在當(dāng)?shù)貢r(shí)間1月4日清晨,谷歌DeepMind創(chuàng)始人兼CEO戴米斯·哈薩比斯(DemisHassabis)發(fā)布推文稱(chēng),Master就是AlphaGo,正式宣布升級(jí)版的AlphaGo問(wèn)世。
劇情像極了電影《終結(jié)者》中,阿諾·施瓦辛格狠狠地甩來(lái)的一句“Iwillbeback!”
AlphaGo曾向多位高手下“戰(zhàn)書(shū)”。韓國(guó)棋院的負(fù)責(zé)人向第一財(cái)經(jīng)記者透露:“此前,Master背后團(tuán)隊(duì)DeepMind曾表示,最后十局,想和曾經(jīng)稱(chēng)雄一時(shí)的各國(guó)圍棋界高手進(jìn)行對(duì)決。應(yīng)該是在這種情況下,‘棋圣’聶衛(wèi)平九段和常昊九段等和Master進(jìn)行了對(duì)決?!?br />
而DeepMind也希望韓國(guó)的曹薰鉉九段和李昌鎬九段兩位“圍棋泰斗”應(yīng)戰(zhàn)。不過(guò),曹薰鉉九段已成為韓國(guó)執(zhí)政黨新國(guó)家黨的國(guó)會(huì)議員,因黨內(nèi)事態(tài)混亂,未接受邀請(qǐng)。
而韓國(guó)圍棋界的另一位泰斗李昌鎬九段拒絕的理由更為“直白”。他表示,自己并不喜歡下互聯(lián)網(wǎng)圍棋,拒絕了對(duì)決請(qǐng)求。
“如果只論勝負(fù)的話,畢竟人工智能沒(méi)有疲勞,也沒(méi)有任何失誤;這種不同于人類(lèi)的絕對(duì)優(yōu)勢(shì),以及可以按照某種特定的規(guī)則進(jìn)行不斷訓(xùn)練的條件,都為它創(chuàng)造了良好的條件,人工智能獲得勝利,不見(jiàn)得是個(gè)意外?!表n國(guó)女棋手尹英敏(音譯)四段說(shuō)。
發(fā)展速度令人震驚
就在去年3月,AlphaGo曾經(jīng)在韓國(guó)打敗了當(dāng)時(shí)韓國(guó)專(zhuān)業(yè)圍棋手李世石,震驚世界;彼時(shí)尹英敏曾經(jīng)確信李世石會(huì)獲得勝利,甚至表示“如果李世石真的輸?shù)簦敲次覀冞@些圍棋指導(dǎo)者,可能就都會(huì)面臨失業(yè)了”。
尹英敏在韓國(guó)首爾運(yùn)營(yíng)一家圍棋培訓(xùn)機(jī)構(gòu)。時(shí)隔近一年,第一財(cái)經(jīng)記者再訪尹英敏,她正在接待來(lái)帶孩子學(xué)習(xí)圍棋的家長(zhǎng)。
“事實(shí)上,世紀(jì)級(jí)人機(jī)大戰(zhàn)過(guò)去一年,不僅沒(méi)有使我失業(yè),反而還使許多民眾的關(guān)注點(diǎn)放在了圍棋上,更多家長(zhǎng)開(kāi)始關(guān)注圍棋對(duì)于兒童智力發(fā)展的促進(jìn);這可能也是人機(jī)大戰(zhàn)給圍棋界帶來(lái)的好處吧。”尹英敏說(shuō)。
而韓國(guó)棋院的負(fù)責(zé)人也證實(shí)說(shuō),“在去年人機(jī)大戰(zhàn)以后,咨詢(xún)觀看圍棋比賽,以及申請(qǐng)參加圍棋段位賽的人數(shù)也有了明顯增多”。
對(duì)于Master的頻傳捷報(bào),尹英敏似乎也看開(kāi)了很多?!翱吹皆S許多多中日韓的頂級(jí)棋手都紛紛敗給AlphaGO,看著這些自己的偶像一個(gè)個(gè)失敗,心中還是有一些吃驚和失落的?!彼寡浴?br />
對(duì)于Master的棋風(fēng)和水平,尹英敏承認(rèn)“要遠(yuǎn)高于此前人機(jī)對(duì)戰(zhàn)時(shí)的AlphaGO,棋風(fēng)穩(wěn)健并極少失誤”,并表示“AlphaGo人工智能的發(fā)展速度著實(shí)令人吃驚”。
哈薩比斯說(shuō),他的團(tuán)隊(duì)一直在致力于提升AlphaGo的性能,過(guò)去幾天他們用新版測(cè)試了幾次非官方的圍棋游戲,這要感謝網(wǎng)名為Magister和Master的賬號(hào),兩者分別在Tygem(弈城圍棋網(wǎng))和FoxGo(野狐)的服務(wù)器上運(yùn)行;也要感謝所有觀看比賽的人。他們對(duì)比賽結(jié)果非常滿(mǎn)意?!案匾氖?,新的AlphaGo在游戲過(guò)程中為圍棋界提供了寶貴的經(jīng)驗(yàn)?!?br />
哈薩比斯還特地提到了在對(duì)弈中失敗的古力,“古力發(fā)表博文稱(chēng),人類(lèi)和人工智能一起將會(huì)很快發(fā)現(xiàn)深度學(xué)習(xí)的奧秘?!?br />
“我們期待官方的測(cè)試,并將于今年再次舉辦整場(chǎng)的圍棋比賽,挖掘AlphaGo博弈過(guò)程中所呈現(xiàn)出來(lái)的創(chuàng)造力?!惫_比斯說(shuō)。
圍棋還能這么下?
2016年12月29日,Master首次出現(xiàn)在弈城,并在當(dāng)晚就很快取得了對(duì)國(guó)內(nèi)高水平職業(yè)棋手的十連勝;30日中午,它又在數(shù)次連勝后,拿下了“韓國(guó)第一人”樸廷桓九段和疑似“中國(guó)第一人”柯潔。
柯潔此前在觀戰(zhàn)時(shí)曾驚嘆:“從來(lái)沒(méi)見(jiàn)過(guò)這樣的招法,圍棋還能這么下?”“人類(lèi)數(shù)千年的實(shí)戰(zhàn)演練進(jìn)化,計(jì)算機(jī)卻告訴我們?nèi)祟?lèi)全都是錯(cuò)的。我覺(jué)得,甚至沒(méi)有一個(gè)人沾到圍棋真理的邊?!?br />
1月4日晚,在連續(xù)對(duì)陣申真谞九段、周睿羊九段、古力九段后,AlphaGo的連勝紀(jì)錄擴(kuò)大到了60場(chǎng),按照事先的計(jì)劃,圍棋程序的非正式比賽測(cè)試暫時(shí)告一段落。
網(wǎng)絡(luò)快棋是目前職業(yè)選手練習(xí)的主要方式之一,因?yàn)槊恳徊剿伎紩r(shí)間很短,與帶獎(jiǎng)金的正式比賽相比,快棋賽中對(duì)決雙方更加容易出錯(cuò),所以這次升級(jí)版AlphaGo的實(shí)際圍棋水平如何還需要正式規(guī)則比賽的進(jìn)一步檢驗(yàn)。
Master展示了人類(lèi)棋手無(wú)法企及的快棋水平,但如果給人類(lèi)足夠的思考時(shí)間,是否結(jié)果會(huì)不同?
沖擊已經(jīng)開(kāi)始 值得一提的是,去年12月13日,多名谷歌高層曾經(jīng)突訪中國(guó),他們?cè)谥袊?guó)棋院與聶衛(wèi)平、柯潔等人進(jìn)行了交流,并達(dá)成了合作協(xié)議。隨后在日本棋院JournalistClub的頒獎(jiǎng)儀式上,哈薩比斯曾表示:“2017年對(duì)AlphaGo和圍棋界都將是充滿(mǎn)興奮的一年?!比藗儧](méi)有意識(shí)到,在新的一年還未到來(lái)時(shí),人工智能對(duì)這項(xiàng)流傳千年的古老技藝的沖擊已經(jīng)開(kāi)始。
芝麻科技創(chuàng)始人、CEO朱智對(duì)第一財(cái)經(jīng)記者表示:“這次比賽相比上次和李世石的三局體現(xiàn)出了AlphaGo更好的穩(wěn)定性和信心。在圍棋這個(gè)領(lǐng)域,人工智能證明了它確實(shí)表現(xiàn)得更好,但這并不意味著機(jī)器具有智慧。事實(shí)上,機(jī)器更擅長(zhǎng)處理這些復(fù)雜的理性問(wèn)題,因此在許多的特定領(lǐng)域,機(jī)器學(xué)習(xí)所帶來(lái)的智能將逐漸改變傳統(tǒng)的模式?!?br />
而Master版本相較AlphaGO是否有升級(jí)與改進(jìn),又究竟是優(yōu)化了什么使其變得如此強(qiáng)大,具體的改進(jìn)方案目前仍沒(méi)有公開(kāi)。人工智能公司第四范式創(chuàng)始人兼CEO戴文淵猜測(cè)認(rèn)為,“經(jīng)過(guò)逾半年的訓(xùn)練,數(shù)據(jù)量應(yīng)該提升了不少,上回訓(xùn)練了800萬(wàn)盤(pán)棋,這次估計(jì)好幾億了。另外針對(duì)上回(對(duì)李世石)第四盤(pán)棋的弱點(diǎn),估計(jì)在訓(xùn)練方法上也有改進(jìn)。”
知乎上同樣引發(fā)了Master是否升級(jí)的討論,一位備注為“未來(lái)知識(shí)圖譜創(chuàng)始人”的用戶(hù)表示,變強(qiáng)的原因在于,“Master是在AlphaGo的基礎(chǔ)上調(diào)整了算法和參數(shù)的,而不是它下過(guò)多少盤(pán)棋,畢竟機(jī)器不會(huì)真的‘學(xué)習(xí)’,它只是在重復(fù)使用人設(shè)定的算法,為優(yōu)化參數(shù)提供數(shù)據(jù)?!?br />
不過(guò)戴文淵認(rèn)為,升級(jí)版的AlphaGo“在對(duì)弈中可能會(huì)有一些隨機(jī)或者非隨機(jī)的擾動(dòng),即選擇不是最優(yōu)的位置落子,嘗試新的可能,不會(huì)是很笨地自己和自己下”。
電氣和電子工程師協(xié)會(huì)(IEEE)高級(jí)會(huì)員、英國(guó)厄爾斯特大學(xué)計(jì)算機(jī)科學(xué)專(zhuān)業(yè)教授柯倫(KevinCurran)對(duì)第一財(cái)經(jīng)記者表示:“AlphaGo的成功就連它的創(chuàng)造者們也大吃一驚。我們都知道AlphaGo已經(jīng)非常先進(jìn)了,但是沒(méi)想到它竟如此優(yōu)秀。由此可見(jiàn),增強(qiáng)學(xué)習(xí)加上‘樹(shù)搜索’而成的算法,的確有效增加了‘勝率’,這是AlphaGo優(yōu)于最厲害的人類(lèi)圍棋選手的地方。同時(shí)我們也不應(yīng)忘記,當(dāng)初谷歌的DeepMind團(tuán)隊(duì)研究人工智能技術(shù)的目的,并不僅僅是為了研發(fā)一套圍棋比賽工具,而是為了在將來(lái)能夠更好地把人工智能科技應(yīng)用到醫(yī)療、機(jī)器人、無(wú)人駕駛汽車(chē)、農(nóng)業(yè)、金融等為人類(lèi)服務(wù)的行業(yè)當(dāng)中。這才是如今科技發(fā)展最讓人驚艷的地方?!?br />
詩(shī)人艾略特說(shuō)過(guò),“去年的話屬于去年的語(yǔ)言,明年的話等待另一種聲音。”這用在人工智能的瞬息巨變上絲毫不差。