寫暴走歐洲的系列文,寫了一半,實在忍不住回過頭來寫圍棋。今天這個題圖,我特意從棋魂動漫 的視頻中,找到這一幕截出來的。

第二盤棋,柯潔中盤認負,盤面上大龍橫死,如果僅從結局來看,似乎沒有第一盤,1/4子小負聽上去那么好。
但實際上,這盤棋的質量和精彩,超出很多人的想象,而我今天要說的是,這是alphago與人類的所有對局里,棋譜最完美的一份。
alphago最早是15年底,alphago V13版本,在未公開的情況下,與退居二線旅居歐洲的職業棋手樊麾老師進行了測試性的對局,五盤不記錄成績的對局里,alphago三勝兩負,(實際上樊老師贏了兩次alphago,不過是V13的版本,阿誰版本的實力尚不足以挑戰人類頂級高手),五盤記錄成績的對局里,alphago五勝零負。
這十盤棋譜,實際上質量都不高,樊老師當時壓力也很大,終究作為第一個輸給AI的職業棋手,情緒上出現顛簸是很難控制的。職業棋手當時基于此棋譜做出判斷,認為AI面對李世石不堪一擊,并非是盲目自信,但樊老師直到半年后,才有機會證明真的并非是本身的問題。
然而職業棋手完全低估了AI自我進化的能力,2016年的alphago V18版本,已經擁有碾壓完爆V13版本的實力,據說是可以讓V13差不久不多3個子的水平。 與李世石的五盤棋的結果大家都知道了,四勝一負,但這五盤棋譜,從質量上來說,也難堪完美,重壓下的李世石多處技術變形,與其巔峰狀態比擬其實還是有所差距;而alphago也存在多處被職業棋手詬病的處理方式,而第4局更是被李世石一個本色上不可立的妙手打爆。
實際上,當時AI即便存在應對錯誤,局面仍然很難說就已經勝負已分。但alphago當時已經出現了嚴重誤判,連續走出重大問題手,導致局面完全不成收拾,最后棋力不錯的黃博士代替AI強行認輸,以免在棋譜上留下更加難堪的一幕。
所以,基于如上,柯潔才發出了,“能贏李世石,不能贏我”的豪言。而一些IT從業者當時已經神話AI,誤以為其棋力已經邁入巔峰,無以倫比,并對職業棋手做出的判斷不屑一顧,其實這也是另一種的狂妄與偏見。
最后打臉這些IT從業者的,恰恰是alphago本身,2016年底alphago V25版本 化名master卷土重來,在網絡上橫掃人類頂尖棋手60盤。2017年與柯潔對戰的這個版本,功力又有提升,根據deepind公司他們本身比來官方公開的信息,這個版本和去年戰勝李世石的V18版真比擬,可以讓前者3個子。
換句話說,去年阿誰版本,在今天的alphago眼里,千瘡百孔,不堪一擊,李世石所發現的問題和缺陷,絕不是僥幸和偶然的。而當時直播中所有做即時點評的嘉賓職業棋手里,只有柯潔的形勢判斷是一直是最準確的,有必然棋力的棋迷想必都還有印象。(我上篇文章是的,柯潔輸了,然而又怎樣。提到這個版本遠勝于去年版本,但當時官方還沒有提到3個子的領先優勢,官方的聲明和數據印證了棋界之前的判斷,也凸顯了王思聰的無理。)
那么,樊老師10盤,李世石5盤,master橫掃60盤,外加柯潔1/4子負的第一盤,截止到昨天為止,一共76盤公開的棋譜,我告訴你們,其實每一個棋譜里, AI都下的不夠完美,當然,這些不完美,有少部分是它依舊不夠完善,有很多是它認為這樣下足夠贏了。
除了連結優勢“穩如狗”的退讓策略,已經被廣泛理解之外。職業棋手對AI棋譜最大的詬病是AI會輕易的濫用先手,將變革走盡。從人類學圍棋的經驗來說,保存變革(專業術語是保存味道)是非常重要的,在后續的對弈中,按照差別的進程會有差別的選擇,并且特別是針對打劫的時候,按照劫爭的大小,先手是可以有選擇的用來作為劫財使用。
但AI專家說,走盡變革是算法剪枝,減少搜索樹的分支,減少后續的計算量。 在過去的70多盤人機對弈里,AI頻頻出現這樣的場景,但很遺憾的是,由于其局面掌控能力過于強大,人類完全無法對這樣的行為作出有效的反制。
那么問題來了,第一,保存變革是否是人類對圍棋一廂情愿的理解?第二,AI是否會在劫爭緊張的時候出現這樣的問題?
所幸這一盤,柯潔的表示,迫使AI作出了答案。
這一盤柯潔的意圖非常明顯,(其實上一盤也很明顯,先撈后洗,簡單說就是先拿住能確定的空,再去破壞對手的成空潛力。) 打亂棋形,通過亂戰尋求機會。而這一戰,柯潔成功的將棋局帶入了本身的意圖。(上一戰,AI在實地和外勢平衡方面,展現了強大的局面控制力,成功的破壞了柯潔的意圖,早早形勢就進入了AI的掌控)