[討論] 電腦弱點:中腹有打劫可能的複雜生死戰?

作者: Vonix (台灣大賭場歡迎您)   2016-03-14 13:19:53
我嘗試用一句話來講ALphaGo的弱點
昨天AlphaGo第一次暴露出弱點,不知道是不是李世石有意為之?
李世石在左右方都避開了戰鬥,卻在大局不利時才在中央掀起戰鬥,
從盤後解析可以看出,白78神手挽回了局面,但若黑棋應對得宜,
局面其實還是細微;但卻造成電腦崩潰自爆。
從機器的角度來理解,中腹戰鬥比邊角更複雜難算,且昨天的例子有
可能形成大劫爭(但打下去黑棋整體也沒有不利),電腦在這種CASE
爆掉,不知道第五盤李世石會不會再度製造這種局面?
作者: aegis43210 (宇宙)   2016-03-14 13:22:00
以小李這等級的棋手,要再度製造這局面並不是不可能
作者: darkseer   2016-03-14 13:24:00
推,另外請問是以演算法觀點來做出這個推論嗎?
作者: profyang (prof)   2016-03-14 13:24:00
你說的沒錯 可是小李居然說弱點是阿發夠執黑有可能會爆之類的 這最好是有關係XD 他該不會故意不講出來弱點吧
作者: darkseer   2016-03-14 13:25:00
他下完二十分鐘就記者會了,要這樣黑李九段太過了吧@@
作者: profyang (prof)   2016-03-14 13:26:00
從演算法角度來看...可能劫爭複雜度更高 他算不清楚勝率如果只是直接打劫可能勝率還算的清楚 但是是很多複雜變化中還有打劫的變化圖的話 可能他勝率就難以正確估算http://www.thenewslens.com/post/297239/ 我沒有要黑小李 我只是想黑這篇報導而已XDD原PO你意思是官子中如果也有劫爭電腦也會算不清嗎?感覺也有可能耶 因為官子通常覺得電腦應該要很強...但如果也有劫爭說不定又要爆了
作者: NaoGaTsu (那歐卡茲)   2016-03-14 13:58:00
神手也不是說下就下得出來,小李78手可以發揮的形勢,至少在左方白塊被強壓黑造就明顯外勢時還看不出來,要說是刻意為之(蓄意造成78手的情形),小李除非有完成窮舉的實力(也就是圍棋上帝),否則根本不可能辦得到。
作者: moonlind (又多了敷臉卡跟覓食卡了~)   2016-03-14 14:01:00
今天的局面可能小李無心造成 但是如果有心引導 有機會因為一場打贏 其實大家也勾勒出AlphaGO的外型了就像古力快變成古力狗一樣 小李應該大多摸清了狗狗個性
作者: NaoGaTsu (那歐卡茲)   2016-03-14 14:03:00
有心引導是一回事,但AlphaGo也不是紙紮的,也要真的能次次應手都如李估計才行,這不窮舉達到圍棋上帝的境界根本不可能。古力昨天也不是次次猜次次中啊。更別說昨天AG大自爆時,並不是判定劫爭應手不利,而是錯
作者: moonlind (又多了敷臉卡跟覓食卡了~)   2016-03-14 14:05:00
目前可以利用的就 狗狗最愛避劫 愛及早定型 愛搶先手
作者: NaoGaTsu (那歐卡茲)   2016-03-14 14:05:00
估79應手的勝率。
作者: darkseer   2016-03-14 14:06:00
再推,我現在對於AlphaGo缺點的看法就是Vonix派XD是不是可以說要製造這種局面,然後之後如果都做出很好的應對(像是白78,以及不犯錯)就有機會坐等自爆『製造局面讓電腦估錯,乘機爭取上風讓電腦自爆』之類?因為讓電腦算錯 及 讓電腦自爆 不必然等同
作者: NaoGaTsu (那歐卡茲)   2016-03-14 14:10:00
若是依這個邏輯,可能的勝點就只有「前盤保守避戰,還得在盤面製造己身大量弱棋區(昨天有三塊弱棋),然後在中腹
作者: blacktom (泉)   2016-03-14 14:10:00
應對得宜應該是白完全不行
作者: moonlind (又多了敷臉卡跟覓食卡了~)   2016-03-14 14:14:00
耶~Nao大你說的不正是李世石拿手好戲嗎?XD
作者: NaoGaTsu (那歐卡茲)   2016-03-14 14:14:00
李世石的拿手好戲是當對手是人時才有辦法刻意經營的,現在的對手是「目前看來」不可能被對手刻意引導的AG耶對手是人時,有棋風、前中盤勢弱區(和邏輯上弱區)的限制,要利用對手的弱點、下棋的慣性去引導還比較容易,要刻意在AG面前造就那樣的局面,若真可以的話,前三盤就不會輸得這麼徹底。
作者: Uizmp (黑袍法師)   2016-03-14 14:18:00
也不一定, 前三盤還沒有測出AG在甚麼情況下有可能爆掉
作者: moonlind (又多了敷臉卡跟覓食卡了~)   2016-03-14 14:21:00
而且今天四盤下來慣性也大概確定了 甚至爆掉後 習慣一樣沒改 包括愛走掉先手 雖然會劫爭 但是先避再說 還有老是愛自損定型
作者: profyang (prof)   2016-03-14 14:26:00
所以我才說如果之後讓柯傑對戰阿發夠不公平 等於小李都幫他試出阿發夠的弱點了 然後給柯潔收成 若是弱點真的這
作者: zeat (L.)   2016-03-14 14:27:00
可是前三盤時的小李對alphago完全不了解,前三盤也算是繳了學費吧
作者: profyang (prof)   2016-03-14 14:27:00
樣 給柯潔來下或者小李自己重新下5盤我覺得都是5:0或4:1
作者: zeat (L.)   2016-03-14 14:28:00
之後柯潔面對的說不定是betago了XD
作者: NaoGaTsu (那歐卡茲)   2016-03-14 14:28:00
怕就是怕都有小李給了五局經驗了,柯潔還是被0:5完結若是如此,就代表阿發狗的bug只有在極端條件下才會被觸
作者: wnglon (冷面笑匠)   2016-03-14 14:29:00
先低調 明天很難說 第三盤的確有劫爭
作者: NaoGaTsu (那歐卡茲)   2016-03-14 14:29:00
發。(光是自我對戰3000萬局都沒發現有這bug,就夠離奇)
作者: darkseer   2016-03-14 14:30:00
(應該說沒有以容易紀錄的方式觸發這個bug?)
作者: profyang (prof)   2016-03-14 14:30:00
等等 你怎麼知道3000萬局沒有bug?難道開發者有時間一局
作者: wnglon (冷面笑匠)   2016-03-14 14:30:00
李的確只贏一盤 只是電腦爆掉的下法
作者: NaoGaTsu (那歐卡茲)   2016-03-14 14:31:00
工程師們也不是領乾薪的好嗎…
作者: wnglon (冷面笑匠)   2016-03-14 14:31:00
連小學生都不如 這才是我失望的所在
作者: profyang (prof)   2016-03-14 14:31:00
類來刻意引出這種變化就不一樣了 畢竟中盤高空戰要出現
作者: profyang (prof)   2016-03-14 14:32:00
所以你覺得開發者有一局局看完?3000萬局?那我真的只能給
作者: NaoGaTsu (那歐卡茲)   2016-03-14 14:32:00
我覺得連小學生都不如這點,才是真的有趣的地方。
作者: darkseer   2016-03-14 14:32:00
推NaoGaTsu,工程師可以寫出很多『壞棋偵測器』
作者: profyang (prof)   2016-03-14 14:33:00
壞棋有那麼好偵測我還研發阿發夠幹嘛
作者: NaoGaTsu (那歐卡茲)   2016-03-14 14:33:00
,設計一台人工智慧下棋機,卻沒有任何驗證程式去確保演算法無誤?也太小看google的技術力了吧 = =
作者: darkseer   2016-03-14 14:33:00
不不,是存下棋譜之後偵測單步有沒有違反基本原則
作者: profyang (prof)   2016-03-14 14:34:00
除非阿發夠爆掉都一定會爆到像昨天那種初學者程度 但如
作者: NaoGaTsu (那歐卡茲)   2016-03-14 14:34:00
我在想,AG自爆後一樣按MCTS運算接下來的勝率落點,但對
作者: moonlind (又多了敷臉卡跟覓食卡了~)   2016-03-14 14:34:00
如果有壞棋偵測器 那我裝在AlphaGO身上就好 今天也不會
作者: darkseer   2016-03-14 14:34:00
譬如101手,應該不會很難偵測吧XD
作者: profyang (prof)   2016-03-14 14:35:00
對阿 如果今天真有這壞棋偵測器 為啥不用來過濾阿發夠下的棋?還是棋時開發者也對這壞棋偵測器沒有信心?
作者: NaoGaTsu (那歐卡茲)   2016-03-14 14:35:00
說白了就是你讓阿發狗跑3000萬個數據群集出來卻沒有任何工具可以分析大數據的正確性,這也太把以搜尋引擎起家的大數據公司「始祖」看太扁了。
作者: Uizmp (黑袍法師)   2016-03-14 14:36:00
AG的團隊中,不是只有aja比較懂圍棋嗎?人也沒有辦法每盤都看
作者: NaoGaTsu (那歐卡茲)   2016-03-14 14:36:00
言而總之,aja他們肯定有辦法找出誤區,否則阿發狗也不
作者: profyang (prof)   2016-03-14 14:36:00
就我看來它們頂多從3000萬局中取出些樣本出來 然後請樊
作者: Uizmp (黑袍法師)   2016-03-14 14:37:00
要用一些條件把這種所謂的bug濾出來, 或者叫AG回報
作者: profyang (prof)   2016-03-14 14:37:00
麾之類的人去看有沒有明顯的壞棋
作者: NaoGaTsu (那歐卡茲)   2016-03-14 14:37:00
= = 有技術開發人工智慧的公司還得用人力驗證是哪招啦
作者: moonlind (又多了敷臉卡跟覓食卡了~)   2016-03-14 14:37:00
AlphaGO是用圖形偵測 怕是到87手才發現整個圖很糟糕
作者: NaoGaTsu (那歐卡茲)   2016-03-14 14:38:00
是啊,AG到87手才找出誤區,但為時已晚,沒屁用啊。
作者: moonlind (又多了敷臉卡跟覓食卡了~)   2016-03-14 14:38:00
AlphaGO的大局觀就是圖形偵測來的 但是也因此失誤
作者: profyang (prof)   2016-03-14 14:39:00
AG只是發現勝率驟降 勝率驟降一定是因為他自己突然下壞棋?所有勝率驟降都是有小學生棋步出現?
作者: NaoGaTsu (那歐卡茲)   2016-03-14 14:39:00
目前看來最有可能的,就是AG一到大劣勢區就運作失能了
作者: darkseer   2016-03-14 14:39:00
AlphaGo可以說用圖形偵測嗎? 我理解那個只是類比@@
作者: NaoGaTsu (那歐卡茲)   2016-03-14 14:40:00
你問的問題只有等aja他們分析完資料才知道是不是了。因為我們目前知道AG發生勝率驟降的案例只有這一次。
作者: profyang (prof)   2016-03-14 14:41:00
你確定那3000萬局沒有?好 退一萬步說 就算它們真的有寫壞棋偵測器 而真的可以準確偵測壞棋 但是那3000萬局也是
作者: moonlind (又多了敷臉卡跟覓食卡了~)   2016-03-14 14:41:00
因為AlphaGO在爆掉之後 還去逃右邊死棋 想圍起來
作者: profyang (prof)   2016-03-14 14:42:00
阿發夠自己在下 目前看來他很可能就是自己迴避劫爭 等於
作者: moonlind (又多了敷臉卡跟覓食卡了~)   2016-03-14 14:42:00
所以我才懷疑 狗狗應該是用圖去感覺 造成大局觀
作者: NaoGaTsu (那歐卡茲)   2016-03-14 14:43:00
我不確定啊,我又不是DM的人。你能確定有?
作者: Uizmp (黑袍法師)   2016-03-14 14:43:00
問題就在於今天這個種東西要怎麼回報, 回報後要怎麼修正
作者: profyang (prof)   2016-03-14 14:43:00
爭 並不是一定要下出劫爭 而是大型攻殺中有打劫的變化我個人對於這個bug要修正不怎麼樂觀 因為這不是告訴阿發
作者: profyang (prof)   2016-03-14 14:44:00
夠說你打劫的時候要多小心就好了 可能是要給他一個全新
作者: NaoGaTsu (那歐卡茲)   2016-03-14 14:44:00
輯出問題,阿發狗自己也無力修正啊。(例如是ValueNetwork給的權重錯誤或估算邏輯上編程錯誤)
作者: moonlind (又多了敷臉卡跟覓食卡了~)   2016-03-14 14:44:00
AlphaGO自我對奕 很多奇怪的bug反而會被隱藏起來
作者: Uizmp (黑袍法師)   2016-03-14 14:44:00
目前來看,AG是有辦法回報79手下錯,但是並沒有回報那些臭棋
作者: NaoGaTsu (那歐卡茲)   2016-03-14 14:45:00
所以嘛,就不是有沒有自我偵測誤區的功能的問題,而是阿
作者: darkseer   2016-03-14 14:45:00
To moonlind & profyang,裝了也有不穩的風險,要測試的話,可以容許壞棋偵測器誤判,實戰不行。說不定測試時就都沒問題,所以就不裝啦。
作者: moonlind (又多了敷臉卡跟覓食卡了~)   2016-03-14 14:45:00
假設兩個笨蛋對奕 越對越聰明的可能性是?
作者: profyang (prof)   2016-03-14 14:46:00
也不是說一定想不出來新演算法 但肯定不是稍微修改一下
作者: NaoGaTsu (那歐卡茲)   2016-03-14 14:46:00
所以一開始的AG會變成只知道圍棋規則的30K棋士。
作者: Uizmp (黑袍法師)   2016-03-14 14:46:00
另外就是為什麼87步時就發現錯誤之後還可以下出97這種棋
作者: profyang (prof)   2016-03-14 14:47:00
對阿 總之也許你們說的對 有裝壞棋偵測器 但這偵測器準
作者: moonlind (又多了敷臉卡跟覓食卡了~)   2016-03-14 14:48:00
因為圖形類比吧 成就了阿法狗的大局觀 但是...
作者: profyang (prof)   2016-03-14 14:48:00
不準我就很質疑了而且就算準 阿發夠他自己的棋風也很可能導致他自己下時
作者: moonlind (又多了敷臉卡跟覓食卡了~)   2016-03-14 14:49:00
例如101手 可能有勝率 前提是李世石不鳥他 但人類怎可能不鳥他 人又不是笨蛋
作者: profyang (prof)   2016-03-14 14:52:00
另一個重點就是這個壞棋偵測棋到底要base on什麼原則去判定?人類對好壞棋的原則?可是我怎麼記得幾天前人類覺得的壞棋五路尖衝還被大大的稱讚?那壞棋偵測器應該要偵測出這種棋嗎?總之好壞棋的判定要化成程式碼我覺得很難 幾乎等於是寫出半個阿發夠了
作者: darkseer   2016-03-14 14:56:00
profyang你說的有道理,確實可能知道有問題但是修不了只是我從資訊產業的觀點,覺得如果知道不會那麼早約戰..像101這種壞棋,我覺得寫個判定棋還是可以的不用很準,Aja或其他人可以從千萬盤抓出幾十盤來人工讀
作者: profyang (prof)   2016-03-14 15:00:00
而且棋時101要說是壞棋 是因為我們覺得他明明死了你還下但說實在的這部棋有損很多目嗎?就官子來看頂多5~6目之類真的筍比較多的我覺得反而是像93這種 外面還被94提掉 還有97也是 更損 但是這種要判定就不像101這麼好判定了何況以上這些"壞棋"如果今天剛好雙方正在打劫 那就叫做找劫材而未必是壞棋了 這時又開怎麼判斷 寫個打劫條件判斷式?可是有時候打劫也未必就一直在打 有時候打一打還會擺著 這時到底算不算"打劫中"?
作者: darkseer   2016-03-14 15:05:00
為了打劫而下101不會對方剛提過劫才可能嗎? 我可能不懂不過確實同意是有不少難處我沒想清楚@@
作者: profyang (prof)   2016-03-14 15:09:00
一般找劫材確實要剛提過劫材可以 但是像剛才講的97這種正常之下非常損的棋 但是如果有要打很大的劫 有時可能會先來下97 這時不是單純的找劫材 而是製造劫材 因為97下了白棋如實戰正常的下了之後 會產生更大的劫材btw可是這場阿發夠確實在自己把打劫的變化削除了之後(91才跑去97製造劫材 所以97才是壞棋
作者: wnglon (冷面笑匠)   2016-03-14 15:26:00
有人說的很對 為何電腦會下101這種棋難道自我練習的三千盤從為出現過?我覺得ag劫爭的邏輯有問題而且電腦不會有情緒問題 是不可能下錯棋而自爆
作者: tsai18 (......)   2016-03-14 15:33:00
Alphago會不會面對業餘棋手更容易輸阿....
作者: wnglon (冷面笑匠)   2016-03-14 15:35:00
有人說ag有學習能力 很多盤面都下過了
作者: Uizmp (黑袍法師)   2016-03-14 15:35:00
不曉得以現在的AG,打劫甚至連環劫分支在評價系統中怎麼評估
作者: wnglon (冷面笑匠)   2016-03-14 15:36:00
但會犯這種錯誤頗無言 所以才推論ag無學習能力 而是用演算法走棋
作者: Uizmp (黑袍法師)   2016-03-14 15:38:00
看定義, 以自適應的方式調整演算法(落子法)叫不叫"學習"
作者: birdy590 (Birdy)   2016-03-14 15:43:00
有點想來整理一下 因為現在看來還是很多人沒搞懂
作者: MicroB ( )   2016-03-14 15:44:00
而且他的學習也不是看過就會 要數量夠大到影響勝率才會改
作者: birdy590 (Birdy)   2016-03-14 15:46:00
請先看一下 7779
作者: aegis43210 (宇宙)   2016-03-14 15:46:00
看ELO就知道了,業餘來下就是被alphaGO穩穩勝
作者: profyang (prof)   2016-03-14 15:48:00
想太多...業餘棋手根本很難在阿發夠面前造成這種局面
作者: ykes60513 (いちご)   2016-03-14 16:23:00
業餘就能簡單找出Bug 那叫黃士傑自己來就行了
作者: broodworld (john)   2016-03-14 16:30:00
我覺得大家想太多,只要盤面太小無爭勝之處就會亂下了下哪都會輸,所以要繳棋賭對方出錯,都應對都投子了只是前3盤領先落後不多才沒看到,我猜自我對亦時師的alphago尾巴就會這樣下
作者: gold97972000 (Miyanaga Saki)   2016-03-14 16:33:00
所以李九段前期避戰是為了製造這樣的局面嗎0.0?神78手 好像想了超過15分鐘的樣子??
作者: darkseer   2016-03-15 14:42:00
profyang你有沒有什麼看法XD? 看了第五局白48開始,我開始覺得你終究是對的,Deepmind可能沒有測試得很徹底+ AlphaGo本身棋風可能找不出這類bug重新用科學家而不是棋迷的角度想,突然覺得更能理解XD現在覺得Deepmind團隊就只是真的想來切磋學習@@

Links booklink

Contact Us: admin [ a t ] ucptt.com