[討論] 電腦弱點：中腹有打劫可能的複雜生死戰？ Vonix PTT批踢踢實業坊

[討論] 電腦弱點：中腹有打劫可能的複雜生死戰？

作者: Vonix (台灣大賭場歡迎您) 2016-03-14 13:19:53

我嘗試用一句話來講ALphaGo的弱點
昨天AlphaGo第一次暴露出弱點，不知道是不是李世石有意為之？
李世石在左右方都避開了戰鬥，卻在大局不利時才在中央掀起戰鬥，
從盤後解析可以看出，白78神手挽回了局面，但若黑棋應對得宜，
局面其實還是細微；但卻造成電腦崩潰自爆。
從機器的角度來理解，中腹戰鬥比邊角更複雜難算，且昨天的例子有
可能形成大劫爭（但打下去黑棋整體也沒有不利），電腦在這種CASE
爆掉，不知道第五盤李世石會不會再度製造這種局面？

作者: aegis43210 (宇宙) 2016-03-14 13:22:00

以小李這等級的棋手，要再度製造這局面並不是不可能

作者: darkseer 2016-03-14 13:24:00

推，另外請問是以演算法觀點來做出這個推論嗎?

作者: profyang (prof) 2016-03-14 13:24:00

你說的沒錯可是小李居然說弱點是阿發夠執黑有可能會爆之類的這最好是有關係XD 他該不會故意不講出來弱點吧

作者: darkseer 2016-03-14 13:25:00

他下完二十分鐘就記者會了，要這樣黑李九段太過了吧@@

作者: profyang (prof) 2016-03-14 13:26:00

從演算法角度來看...可能劫爭複雜度更高他算不清楚勝率如果只是直接打劫可能勝率還算的清楚但是是很多複雜變化中還有打劫的變化圖的話可能他勝率就難以正確估算http://www.thenewslens.com/post/297239/ 我沒有要黑小李我只是想黑這篇報導而已XDD原PO你意思是官子中如果也有劫爭電腦也會算不清嗎?感覺也有可能耶因為官子通常覺得電腦應該要很強...但如果也有劫爭說不定又要爆了

作者: NaoGaTsu (那歐卡茲) 2016-03-14 13:58:00

神手也不是說下就下得出來，小李78手可以發揮的形勢，至少在左方白塊被強壓黑造就明顯外勢時還看不出來，要說是刻意為之(蓄意造成78手的情形)，小李除非有完成窮舉的實力(也就是圍棋上帝)，否則根本不可能辦得到。

作者: moonlind (又多了敷臉卡跟覓食卡了~) 2016-03-14 14:01:00

今天的局面可能小李無心造成但是如果有心引導有機會因為一場打贏其實大家也勾勒出AlphaGO的外型了就像古力快變成古力狗一樣小李應該大多摸清了狗狗個性

作者: NaoGaTsu (那歐卡茲) 2016-03-14 14:03:00

有心引導是一回事，但AlphaGo也不是紙紮的，也要真的能次次應手都如李估計才行，這不窮舉達到圍棋上帝的境界根本不可能。古力昨天也不是次次猜次次中啊。更別說昨天AG大自爆時，並不是判定劫爭應手不利，而是錯

作者: moonlind (又多了敷臉卡跟覓食卡了~) 2016-03-14 14:05:00

目前可以利用的就狗狗最愛避劫愛及早定型愛搶先手

作者: NaoGaTsu (那歐卡茲) 2016-03-14 14:05:00

估79應手的勝率。

作者: darkseer 2016-03-14 14:06:00

再推，我現在對於AlphaGo缺點的看法就是Vonix派XD是不是可以說要製造這種局面，然後之後如果都做出很好的應對(像是白78，以及不犯錯)就有機會坐等自爆『製造局面讓電腦估錯，乘機爭取上風讓電腦自爆』之類?因為讓電腦算錯及讓電腦自爆不必然等同

作者: NaoGaTsu (那歐卡茲) 2016-03-14 14:10:00

若是依這個邏輯，可能的勝點就只有「前盤保守避戰，還得在盤面製造己身大量弱棋區(昨天有三塊弱棋)，然後在中腹

作者: blacktom (泉) 2016-03-14 14:10:00

應對得宜應該是白完全不行

作者: moonlind (又多了敷臉卡跟覓食卡了~) 2016-03-14 14:14:00

耶~Nao大你說的不正是李世石拿手好戲嗎?XD

作者: NaoGaTsu (那歐卡茲) 2016-03-14 14:14:00

李世石的拿手好戲是當對手是人時才有辦法刻意經營的，現在的對手是「目前看來」不可能被對手刻意引導的AG耶對手是人時，有棋風、前中盤勢弱區(和邏輯上弱區)的限制，要利用對手的弱點、下棋的慣性去引導還比較容易，要刻意在AG面前造就那樣的局面，若真可以的話，前三盤就不會輸得這麼徹底。

作者: Uizmp (黑袍法師) 2016-03-14 14:18:00

也不一定, 前三盤還沒有測出AG在甚麼情況下有可能爆掉

作者: moonlind (又多了敷臉卡跟覓食卡了~) 2016-03-14 14:21:00

而且今天四盤下來慣性也大概確定了甚至爆掉後習慣一樣沒改包括愛走掉先手雖然會劫爭但是先避再說還有老是愛自損定型

作者: profyang (prof) 2016-03-14 14:26:00

所以我才說如果之後讓柯傑對戰阿發夠不公平等於小李都幫他試出阿發夠的弱點了然後給柯潔收成若是弱點真的這

作者: zeat (L.) 2016-03-14 14:27:00

可是前三盤時的小李對alphago完全不了解，前三盤也算是繳了學費吧

作者: profyang (prof) 2016-03-14 14:27:00

樣給柯潔來下或者小李自己重新下5盤我覺得都是5:0或4:1

作者: zeat (L.) 2016-03-14 14:28:00

之後柯潔面對的說不定是betago了XD

作者: NaoGaTsu (那歐卡茲) 2016-03-14 14:28:00

怕就是怕都有小李給了五局經驗了，柯潔還是被0:5完結若是如此，就代表阿發狗的bug只有在極端條件下才會被觸

作者: wnglon (冷面笑匠) 2016-03-14 14:29:00

先低調明天很難說第三盤的確有劫爭

作者: NaoGaTsu (那歐卡茲) 2016-03-14 14:29:00

發。(光是自我對戰3000萬局都沒發現有這bug，就夠離奇)

作者: darkseer 2016-03-14 14:30:00

(應該說沒有以容易紀錄的方式觸發這個bug?)

作者: profyang (prof) 2016-03-14 14:30:00

等等你怎麼知道3000萬局沒有bug?難道開發者有時間一局

作者: wnglon (冷面笑匠) 2016-03-14 14:30:00

李的確只贏一盤只是電腦爆掉的下法

作者: NaoGaTsu (那歐卡茲) 2016-03-14 14:31:00

工程師們也不是領乾薪的好嗎…

作者: wnglon (冷面笑匠) 2016-03-14 14:31:00

連小學生都不如這才是我失望的所在

作者: profyang (prof) 2016-03-14 14:31:00

類來刻意引出這種變化就不一樣了畢竟中盤高空戰要出現

作者: profyang (prof) 2016-03-14 14:32:00

所以你覺得開發者有一局局看完?3000萬局?那我真的只能給

作者: NaoGaTsu (那歐卡茲) 2016-03-14 14:32:00

我覺得連小學生都不如這點，才是真的有趣的地方。

作者: darkseer 2016-03-14 14:32:00

推NaoGaTsu，工程師可以寫出很多『壞棋偵測器』

作者: profyang (prof) 2016-03-14 14:33:00

壞棋有那麼好偵測我還研發阿發夠幹嘛

作者: NaoGaTsu (那歐卡茲) 2016-03-14 14:33:00

，設計一台人工智慧下棋機，卻沒有任何驗證程式去確保演算法無誤？也太小看google的技術力了吧 = =

作者: darkseer 2016-03-14 14:33:00

不不，是存下棋譜之後偵測單步有沒有違反基本原則

作者: profyang (prof) 2016-03-14 14:34:00

除非阿發夠爆掉都一定會爆到像昨天那種初學者程度但如

作者: NaoGaTsu (那歐卡茲) 2016-03-14 14:34:00

我在想，AG自爆後一樣按MCTS運算接下來的勝率落點，但對

作者: moonlind (又多了敷臉卡跟覓食卡了~) 2016-03-14 14:34:00

如果有壞棋偵測器那我裝在AlphaGO身上就好今天也不會

作者: darkseer 2016-03-14 14:34:00

譬如101手，應該不會很難偵測吧XD

作者: profyang (prof) 2016-03-14 14:35:00

對阿如果今天真有這壞棋偵測器為啥不用來過濾阿發夠下的棋?還是棋時開發者也對這壞棋偵測器沒有信心?

作者: NaoGaTsu (那歐卡茲) 2016-03-14 14:35:00

說白了就是你讓阿發狗跑3000萬個數據群集出來卻沒有任何工具可以分析大數據的正確性，這也太把以搜尋引擎起家的大數據公司「始祖」看太扁了。

作者: Uizmp (黑袍法師) 2016-03-14 14:36:00

AG的團隊中,不是只有aja比較懂圍棋嗎?人也沒有辦法每盤都看

作者: NaoGaTsu (那歐卡茲) 2016-03-14 14:36:00

言而總之，aja他們肯定有辦法找出誤區，否則阿發狗也不

作者: profyang (prof) 2016-03-14 14:36:00

就我看來它們頂多從3000萬局中取出些樣本出來然後請樊

作者: Uizmp (黑袍法師) 2016-03-14 14:37:00

要用一些條件把這種所謂的bug濾出來, 或者叫AG回報

作者: profyang (prof) 2016-03-14 14:37:00

麾之類的人去看有沒有明顯的壞棋

作者: NaoGaTsu (那歐卡茲) 2016-03-14 14:37:00

= = 有技術開發人工智慧的公司還得用人力驗證是哪招啦

作者: moonlind (又多了敷臉卡跟覓食卡了~) 2016-03-14 14:37:00

AlphaGO是用圖形偵測怕是到87手才發現整個圖很糟糕

作者: NaoGaTsu (那歐卡茲) 2016-03-14 14:38:00

是啊，AG到87手才找出誤區，但為時已晚，沒屁用啊。

作者: moonlind (又多了敷臉卡跟覓食卡了~) 2016-03-14 14:38:00

AlphaGO的大局觀就是圖形偵測來的但是也因此失誤

作者: profyang (prof) 2016-03-14 14:39:00

AG只是發現勝率驟降勝率驟降一定是因為他自己突然下壞棋?所有勝率驟降都是有小學生棋步出現?

作者: NaoGaTsu (那歐卡茲) 2016-03-14 14:39:00

目前看來最有可能的，就是AG一到大劣勢區就運作失能了

作者: darkseer 2016-03-14 14:39:00

AlphaGo可以說用圖形偵測嗎? 我理解那個只是類比@@

作者: NaoGaTsu (那歐卡茲) 2016-03-14 14:40:00

你問的問題只有等aja他們分析完資料才知道是不是了。因為我們目前知道AG發生勝率驟降的案例只有這一次。

作者: profyang (prof) 2016-03-14 14:41:00

你確定那3000萬局沒有?好退一萬步說就算它們真的有寫壞棋偵測器而真的可以準確偵測壞棋但是那3000萬局也是

作者: moonlind (又多了敷臉卡跟覓食卡了~) 2016-03-14 14:41:00

因為AlphaGO在爆掉之後還去逃右邊死棋想圍起來

作者: profyang (prof) 2016-03-14 14:42:00

阿發夠自己在下目前看來他很可能就是自己迴避劫爭等於

作者: moonlind (又多了敷臉卡跟覓食卡了~) 2016-03-14 14:42:00

所以我才懷疑狗狗應該是用圖去感覺造成大局觀

作者: NaoGaTsu (那歐卡茲) 2016-03-14 14:43:00

我不確定啊，我又不是DM的人。你能確定有？

作者: Uizmp (黑袍法師) 2016-03-14 14:43:00

問題就在於今天這個種東西要怎麼回報, 回報後要怎麼修正

作者: profyang (prof) 2016-03-14 14:43:00

爭並不是一定要下出劫爭而是大型攻殺中有打劫的變化我個人對於這個bug要修正不怎麼樂觀因為這不是告訴阿發

作者: profyang (prof) 2016-03-14 14:44:00

夠說你打劫的時候要多小心就好了可能是要給他一個全新

作者: NaoGaTsu (那歐卡茲) 2016-03-14 14:44:00

輯出問題，阿發狗自己也無力修正啊。(例如是ValueNetwork給的權重錯誤或估算邏輯上編程錯誤)

作者: moonlind (又多了敷臉卡跟覓食卡了~) 2016-03-14 14:44:00

AlphaGO自我對奕很多奇怪的bug反而會被隱藏起來

作者: Uizmp (黑袍法師) 2016-03-14 14:44:00

目前來看,AG是有辦法回報79手下錯,但是並沒有回報那些臭棋

作者: NaoGaTsu (那歐卡茲) 2016-03-14 14:45:00

所以嘛，就不是有沒有自我偵測誤區的功能的問題，而是阿

作者: darkseer 2016-03-14 14:45:00

To moonlind & profyang，裝了也有不穩的風險，要測試的話，可以容許壞棋偵測器誤判，實戰不行。說不定測試時就都沒問題，所以就不裝啦。

作者: moonlind (又多了敷臉卡跟覓食卡了~) 2016-03-14 14:45:00

假設兩個笨蛋對奕越對越聰明的可能性是?

作者: profyang (prof) 2016-03-14 14:46:00

也不是說一定想不出來新演算法但肯定不是稍微修改一下

作者: NaoGaTsu (那歐卡茲) 2016-03-14 14:46:00

所以一開始的AG會變成只知道圍棋規則的30K棋士。

作者: Uizmp (黑袍法師) 2016-03-14 14:46:00

另外就是為什麼87步時就發現錯誤之後還可以下出97這種棋

作者: profyang (prof) 2016-03-14 14:47:00

對阿總之也許你們說的對有裝壞棋偵測器但這偵測器準

作者: moonlind (又多了敷臉卡跟覓食卡了~) 2016-03-14 14:48:00

因為圖形類比吧成就了阿法狗的大局觀但是...

作者: profyang (prof) 2016-03-14 14:48:00

不準我就很質疑了而且就算準阿發夠他自己的棋風也很可能導致他自己下時

作者: moonlind (又多了敷臉卡跟覓食卡了~) 2016-03-14 14:49:00

例如101手可能有勝率前提是李世石不鳥他但人類怎可能不鳥他人又不是笨蛋

作者: profyang (prof) 2016-03-14 14:52:00

另一個重點就是這個壞棋偵測棋到底要base on什麼原則去判定?人類對好壞棋的原則?可是我怎麼記得幾天前人類覺得的壞棋五路尖衝還被大大的稱讚?那壞棋偵測器應該要偵測出這種棋嗎?總之好壞棋的判定要化成程式碼我覺得很難幾乎等於是寫出半個阿發夠了

作者: darkseer 2016-03-14 14:56:00

profyang你說的有道理，確實可能知道有問題但是修不了只是我從資訊產業的觀點，覺得如果知道不會那麼早約戰..像101這種壞棋，我覺得寫個判定棋還是可以的不用很準，Aja或其他人可以從千萬盤抓出幾十盤來人工讀

作者: profyang (prof) 2016-03-14 15:00:00

而且棋時101要說是壞棋是因為我們覺得他明明死了你還下但說實在的這部棋有損很多目嗎?就官子來看頂多5~6目之類真的筍比較多的我覺得反而是像93這種外面還被94提掉還有97也是更損但是這種要判定就不像101這麼好判定了何況以上這些"壞棋"如果今天剛好雙方正在打劫那就叫做找劫材而未必是壞棋了這時又開怎麼判斷寫個打劫條件判斷式?可是有時候打劫也未必就一直在打有時候打一打還會擺著這時到底算不算"打劫中"?

作者: darkseer 2016-03-14 15:05:00

為了打劫而下101不會對方剛提過劫才可能嗎? 我可能不懂不過確實同意是有不少難處我沒想清楚@@

作者: profyang (prof) 2016-03-14 15:09:00

一般找劫材確實要剛提過劫材可以但是像剛才講的97這種正常之下非常損的棋但是如果有要打很大的劫有時可能會先來下97 這時不是單純的找劫材而是製造劫材因為97下了白棋如實戰正常的下了之後會產生更大的劫材btw可是這場阿發夠確實在自己把打劫的變化削除了之後(91才跑去97製造劫材所以97才是壞棋

作者: wnglon (冷面笑匠) 2016-03-14 15:26:00

有人說的很對為何電腦會下101這種棋難道自我練習的三千盤從為出現過?我覺得ag劫爭的邏輯有問題而且電腦不會有情緒問題是不可能下錯棋而自爆

作者: tsai18 (......) 2016-03-14 15:33:00

Alphago會不會面對業餘棋手更容易輸阿....

作者: wnglon (冷面笑匠) 2016-03-14 15:35:00

有人說ag有學習能力很多盤面都下過了

作者: Uizmp (黑袍法師) 2016-03-14 15:35:00

不曉得以現在的AG,打劫甚至連環劫分支在評價系統中怎麼評估

作者: wnglon (冷面笑匠) 2016-03-14 15:36:00

但會犯這種錯誤頗無言所以才推論ag無學習能力而是用演算法走棋

作者: Uizmp (黑袍法師) 2016-03-14 15:38:00

看定義, 以自適應的方式調整演算法(落子法)叫不叫"學習"

作者: birdy590 (Birdy) 2016-03-14 15:43:00

有點想來整理一下因為現在看來還是很多人沒搞懂

作者: MicroB ( ) 2016-03-14 15:44:00

而且他的學習也不是看過就會要數量夠大到影響勝率才會改

作者: birdy590 (Birdy) 2016-03-14 15:46:00

請先看一下 7779

作者: aegis43210 (宇宙) 2016-03-14 15:46:00

看ELO就知道了，業餘來下就是被alphaGO穩穩勝

作者: profyang (prof) 2016-03-14 15:48:00

想太多...業餘棋手根本很難在阿發夠面前造成這種局面

作者: ykes60513 (いちご) 2016-03-14 16:23:00

業餘就能簡單找出Bug 那叫黃士傑自己來就行了

作者: broodworld (john) 2016-03-14 16:30:00

我覺得大家想太多,只要盤面太小無爭勝之處就會亂下了下哪都會輸,所以要繳棋賭對方出錯,都應對都投子了只是前3盤領先落後不多才沒看到,我猜自我對亦時師的alphago尾巴就會這樣下

作者: gold97972000 (Miyanaga Saki) 2016-03-14 16:33:00

所以李九段前期避戰是為了製造這樣的局面嗎0.0?神78手好像想了超過15分鐘的樣子??

作者: darkseer 2016-03-15 14:42:00

profyang你有沒有什麼看法XD? 看了第五局白48開始，我開始覺得你終究是對的，Deepmind可能沒有測試得很徹底+ AlphaGo本身棋風可能找不出這類bug重新用科學家而不是棋迷的角度想，突然覺得更能理解XD現在覺得Deepmind團隊就只是真的想來切磋學習@@

繼續閱讀

Re: [心得] 圍棋AI AlphaGo 之我見kafai [問題] 職業棋手一生的對弈／訓練量？upu Re: [心得] 古今世界圍棋高手的比較 / 圍棋基本理解Rueyh [棋訊] Alpha Go 來 ELO 參一腳了helloallen29 [轉錄] 「戰勝自己」對於AlphaGo而言不只是口號Tkuei [心得] 電腦和圍棋高手對弈可以取勝不足為怪willrise Re: [討論] 人機對戰的熱潮後，要如何推廣圍棋呢?librevie Re: [影片] 張東岳解說李世石獲勝第四盤mathbug [心得] 古今世界圍棋高手的比較 / 圍棋基本理解emptyfree [新聞] 李世石勝利至少5層內涵圍棋將迎黃金時代?zkow