[問題] 想問李世石alphago第四戰那一手

作者: jane3031 (珊牛)   2018-07-20 15:21:47
本身很少在下圍棋但很想知道第四戰李世石對alphago那一場電腦到底是什麼缺陷?
第78手時alphago預判李世石下那手的機率是0.0007
結果下了以後電腦開始亂下
我的問題是:
1.電腦之所以會亂下是因為機率太低、alphago在那樣情況下的棋譜樣本不夠所以alphago不知道該下哪嗎?
2.所以第78手以棋手來看是很笨穩輸的一手嗎?如果是人類棋手對人類棋手李世石第78手會穩輸嗎?
作者: HeterCompute (異質運算)   2018-07-20 16:41:00
電腦之所以亂下是因為他自認的前幾個選點都找不到好方法,於是開始找一些對方必定得應的地方來維持勝率,但是那幾手全部都是虧的,原來的問題還是無法解決,所以電腦就看起來像是在亂下導致輸棋而造成的原因確實是因為棋譜樣本不夠以人類棋手來看,需要一些時間計算來下出正確著手強職業可能10分鐘就把裡面全部看清了,但如果在時間緊迫的情況下也有可能應對錯誤,但無論如何都不會像實戰電腦發瘋那樣慘就是了
作者: jane3031 (珊牛)   2018-07-20 17:59:00
所以如果是面對人類棋手而不是電腦的話是不會下出那樣的78手嗎?所以這樣評論對嗎「這場本應是穩穩的由alphago勝出,但李世石靠著人類不會犯的錯的電腦漏洞而產生逆轉」
作者: callpolice (宜蘭拔刀齋)   2018-07-20 19:07:00
不,不會因為對方是誰就下出怎樣的棋步,同樣的盤面,不論對手是誰,自己想出的最佳解都是一樣的
作者: HeterCompute (異質運算)   2018-07-20 19:07:00
面對人類棋手也會下78手,因為李世石也是選最複雜
作者: kenwufederer (Nash)   2018-07-20 19:07:00
對方如果是人類,小李不會這樣下
作者: HeterCompute (異質運算)   2018-07-20 19:08:00
的下,這場也是應該由alphago穩穩勝出
作者: kenwufederer (Nash)   2018-07-20 19:08:00
看小李一直忍住不斷就覺得心裡有需影響
作者: callpolice (宜蘭拔刀齋)   2018-07-20 19:08:00
除非是實力有落差要故意退讓
作者: kenwufederer (Nash)   2018-07-20 19:09:00
否則對電腦來說,你從第一步就是不成立的
作者: HeterCompute (異質運算)   2018-07-20 19:09:00
應該說第四盤一開始的策略就是刻意營造出來的,所以前面對人類不會這樣下,不過78手對李世石應該是唯一一手
作者: kenwufederer (Nash)   2018-07-20 19:10:00
靠BUG也是獲勝,不會有人去否定那一場的勝利
作者: callpolice (宜蘭拔刀齋)   2018-07-20 19:10:00
所以重點不在於是人還是電腦,而是你知道自己和對手的棋力後擬出的策略
作者: HeterCompute (異質運算)   2018-07-20 19:11:00
人類本來就會因為對手而選擇不一樣的下法
作者: ilw4e (可以吃嗎?)   2018-07-20 19:47:00
那時候的電腦就是還沒完全體,現在版的下幾手就會自己投了李那手在電腦意料外原本就算得少,然後又算錯就開始崩了
作者: ddavid (謊言接線生)   2018-07-21 05:30:00
用人類的說法就是,AlphaGo沒排過這個定石或手筋,臨場又來不及算出來所以爆破了至於為什麼爆破後會看起來亂下,我在 #1P_VopGM 有做比較詳細的解釋一樓說「找必應的地方來維持勝率」我個人覺得不算是最正確的解釋,不過以人來解讀是一定程度可以那麼解釋
作者: HeterCompute (異質運算)   2018-07-21 06:00:00
樓上是不是搞錯了?這篇專門討論第4局78手
作者: ddavid (謊言接線生)   2018-07-21 19:42:00
我並沒有搞錯啊,那一挖造成的後續詭異下法本來就是這一類的問題「找必應的地方來維持勝率」這個說法是人為解讀過的加料,事實上就是「維持勝率」而已,AI並不會特別去想什麼必應不必應的,只不過在當下情況,飲鳩止渴的必應手剛好會是最能帶來「維持現狀」假象的下法而已勝率暫時掉最少就被視為是目前最佳著手而已
作者: HeterCompute (異質運算)   2018-07-21 20:30:00
「找必應的地方來維持勝率」只是描述行為結果,也沒加料
作者: ddavid (謊言接線生)   2018-07-22 16:50:00
我不是說你真的講錯了,但是這句就是太過人為解讀後的結果假設有一處著手對方沒有必應,但是剛好勝率就跟所謂必應之處維持差不多,AI一樣會去選擇這個著手,它並沒有刻意去選必應之處只是因為下到這種局面很有可能「只剩」必應之處不會太快掉勝率,所以才會表現出只下這些地方,因果是相反的
作者: enjoytbook (en)   2018-07-23 19:15:00
應該說電腦不會打亂局面這種下法,那時候就是被逼到沒琪了卻不會認輸吧?
作者: ddavid (謊言接線生)   2018-07-23 19:53:00
也是理由之一。AI其實並不知道什麼局面複不複雜,所以也沒有什麼就算勝率低但是複雜亂戰的思考方向,它找不出那種人類思維中雖然並非最佳著手但可以亂戰一拚的勝負手概念
作者: wadashi1 (阿拉丁)   2018-07-24 09:28:00
3天版的AG Zero跟李世石版對奕已經100盤100連勝是自己對奕而來,並非由李世石版本進化,無版本演進剋制問題!是可以討論第78手,但那也只是曾勝過李世石版的指標!真要研究,相信黃士傑博士早有答案,之前他也說過,Master跟Zero版都已克服這一手的問題,接著下都不會有亂下的狀況。真要研究的話,請dp用出變化棋譜可能有些麻煩,但LZ這個免費軟體,不知道有沒有人拿來試過?

Links booklink

Contact Us: admin [ a t ] ucptt.com