Re: [心得] 這五局對AlphaGo的評價

作者: wnglon (冷面笑匠)   2016-03-15 21:08:04
※ 引述《shehrevar (阿浩)》之銘言:
: 1. 這五局質感 3>2>4>5>1
: 第三局的象飛,往上跳一手的大局觀,第二局的五路尖沖,相信可以給人類帶來新思想
: 2. AlphaGo的實力>>小李
: 第四局就不說了,電腦算不到這手整個就爛掉之外,其他四局從頭領先到尾
: 李世石完全無任何機會,以最後一局來說好了,AlphaGo官子並不出色
: 我想AlphaGo的"國際禮儀"應該表現得很好,有種不要贏太多的感覺,贏了就好
: 縱使事後研究應該要怎樣怎樣,對AlphaGo都一樣,世界第三實至名歸(暫時)
: 3. AlphaGo先交換定型
: 初期來看真的是完全浪費劫財,(之前第二局小目下拖定石刺一個配合5路尖沖完美)
: 右下角的交換在收官的時候卻派上用場,這或許之後下也一樣,但是對於之後戰鬥
: 我不覺得有那裡損失
: 4. AlphaGo打劫
: 就如眾高手說的,能不打則不打,減少變化,但好像真的要下出打劫是多麼難的事情
: 平常打劫隨處可見,對上AlphaGo就幾乎完全消失,值得研究,也呼應第三點
: 既然不打劫,何不趕快定型好,省得日後應手有變
: 5. AlphaGo進化
: 想知道如果拿出最佳勝率點以及最佳目數點的話,可以讓人類幾目,我猜可以兩子
我認為對手是電腦
能抓到演算法的破綻就很夠了
以電玩來說
玩家打電玩一開始會狂輸好幾場
但總是有些玩家一開始吃虧
後來抓到魔王AI的BUG
從這BUG衍伸出許多攻擊策略
過幾天開始就已經打倒魔王
到最後則是挑戰無損血K.O.魔王
另外有沒有聽過打不倒的空氣人這首歌?
為何該玩家打不倒空氣人
為何專版會有一堆人會說空氣人很弱
為何網路上有一堆無損血KO空氣人的play
有沒有針對電腦AI的BUG作攻擊策略
我想是人類戰勝AI的重要關鍵
這種通常要練習幾百場 一旦抓到攻擊策略
電腦就等著吃鱉
我認為李世石才玩五場就抓到AI之弱點
一旦玩個幾百場
阿發狗還用混嗎?
看程式設計者賽後心情有點不好
可能是該玩家玩五場就抓到弱點後
如果給其他玩家對奕 會衍伸出一些針對阿發狗的策略
到最後連普通玩家都能幹掉阿發狗
那就很不好了
題外話:
有跟星海爭霸2的AI打過
一開始打也都是絕望
正面根本不能贏電腦
後來嘗試用快攻與偷襲
並觀察電腦AI的習性
大約三十幾場後 殘酷的電腦就變肥料了
我認為要給李世石多玩幾場
說不定情況會大不相同
一點淺見
其實我看李輸 還蠻難過的
希望人類不會輸給電腦AI
作者: wahdee (=.=)   2016-03-15 21:12:00
深藍也只敢偷襲一次 而且是由人作最後決策 ( ′-`)y-~
作者: scju (QQ)   2016-03-15 21:12:00
照你這樣講,人類會進步,電腦難道就不會自我學習進步嗎?
作者: pikachu2421 (皮卡@めぐ民)   2016-03-15 21:12:00
但是AlphaGo還會再改進 進化
作者: scju (QQ)   2016-03-15 21:13:00
幾個月後再來,阿爾發GO就更厲害了啊。
作者: Atropos0723 (Atropos)   2016-03-15 21:16:00
這樣分析的前提是阿法真有運算架構上的BUG
作者: birdy590 (Birdy)   2016-03-15 21:17:00
李世石的格局顯然不只這樣而已, 不然 G5 不會自願拿黑棋
作者: LaPass (LaPass)   2016-03-15 21:18:00
請問,第五局不是本來就是李拿黑嗎?我一直搞不清楚自願拿黑是怎麼回事
作者: Atropos0723 (Atropos)   2016-03-15 21:19:00
但是現在的消息來看,是演算資源限制它捨棄機率過小
作者: zelkova (*〞︶〝*)   2016-03-15 21:19:00
無傷過空氣人是運氣吧 那個龍捲風是隨機的
作者: Atropos0723 (Atropos)   2016-03-15 21:20:00
的棋步,換句話說下快棋就是他的罩門
作者: LaPass (LaPass)   2016-03-15 21:20:00
是每次開始都會先猜子,但是第五局李表示想拿黑這樣嗎?還是照順序,李應該拿白,但是裡要求拿黑?
作者: birdy590 (Birdy)   2016-03-15 21:20:00
按規則第五盤要重新猜先, 但是李世石想拿黑 雙方協調OK
作者: LaPass (LaPass)   2016-03-15 21:21:00
原來如此,了解了
作者: birdy590 (Birdy)   2016-03-15 21:22:00
不是在棋盤上真劍勝負, 就沒有那種氣魄了
作者: aaaba (小強)   2016-03-15 21:22:00
當場猜對李不利啊
作者: shehrevar (阿浩)   2016-03-15 21:22:00
這算抓到弱點嗎?google辦這比賽的目的就是要找到這bug如果電腦有選到這手,第四局一樣GG~當然能讓電腦忽略這手小李也是威猛沒錯
作者: DemonElf (LdsFish)   2016-03-15 21:31:00
原PO提到星海有學習的能力是學玩家的而不是"自我學習"Alphago的演算計往跟以往AI的窮舉方式都是有所不同的他是因應圍棋算不完那就在有限時間內盡可能算出最大勝率也就是說當然也會有他算不完而輸的可能,比方說Google自己就有提到連線的分散式Alphago對單機Alphago勝率約7成
作者: chang505 (眼線)   2016-03-15 21:34:00
你一定不是寫程式的,有人幫忙抓到bug有多爽
作者: DemonElf (LdsFish)   2016-03-15 21:34:00
觀察起來Google其實很有心測試Alphago的演算能力,除了比賽前就停掉Alphago的學習(也就是這五場都是同一版本)細心一點的人就會發現Alphago並沒有特別分配時間再把運算在時間明明還很充裕的情況下再多算一點
作者: jpg31415926 (圓週率π)   2016-03-15 21:38:00
Google花了錢當然希望有成效阿 贏了出名 輸了抓蟲怎樣都不虧阿
作者: DemonElf (LdsFish)   2016-03-15 21:38:00
Google應該是為了確認演算法的極限所以還自主設了一些運算時間(/次數?)限制
作者: DemonElf (LdsFish)   2016-03-15 21:40:00
真的,這次大賽對雙方來說都是很寶貴的收穫建議原PO去Google一下"深度學習"的文章多了解一下Alphago很有價值的一點就是他能"自我對奕"也所以他能一定程試自主修正原本的水準
作者: LaPass (LaPass)   2016-03-15 21:45:00
樓上,答案是不一定。
作者: DemonElf (LdsFish)   2016-03-15 21:46:00
Alphago從去年約六段職業棋手的實力提升到現在能贏九段就是突顯深度學習的價值
作者: LaPass (LaPass)   2016-03-15 21:47:00
有些先天的決策問題是要去修程式碼才能解決的,例如不是走最佳棋步,而是走勝率最高的棋步之類的。這會導致中盤贏
作者: DemonElf (LdsFish)   2016-03-15 21:48:00
我說明的並不是Alphago是完美的啊,完美的話就不會輸了
作者: LaPass (LaPass)   2016-03-15 21:49:00
50目,最後只贏2.5目這種狀況。這主要是蒙地卡羅看的是勝率,而不是贏棋數的原因。也就是說對狗狗而言,贏0.5目跟贏55.5目是一樣的。所以在大優勢的狀況下會一直送,因為他覺得勝率差不多。
作者: DemonElf (LdsFish)   2016-03-15 21:50:00
要我來說的話,這不叫BUG,而是數學,這結果代表以勝率
作者: LaPass (LaPass)   2016-03-15 21:51:00
然後,輸太多的話,像第四局,會想要一口氣贏二十幾目回來
作者: DemonElf (LdsFish)   2016-03-15 21:51:00
為優先的演算法還是很有調整空間
作者: LaPass (LaPass)   2016-03-15 21:52:00
,而不是跟人類一樣,一點一點的追回來,等對方失誤時在超越
作者: DemonElf (LdsFish)   2016-03-15 21:52:00
在看這幾局總覺得很多人會把下好下壞都看得太偏
作者: DemonElf (LdsFish)   2016-03-15 21:53:00
回歸到人跟人下棋時,之所以有輸贏不也是因為好手與失誤的統合結果,但是放到人機對戰就好像失誤就都不正常了只要圍棋還是"算不完",那麼永遠就只會有較佳而不是完美解,而且也有新聞提到開始有高段棋手試著採用Alphago的的勝率流概念、而且還下贏了,這代表的是這樣的演算技術不僅是展現了科學上的價值,也可以幫他所涉及領域突破原本的經驗框架再求精進
作者: birdy590 (Birdy)   2016-03-15 22:01:00
G4 那一連串異常只能視為 bug... 一步沒算到不是問題但是接下來連續幾步繼續送棋. 是不應該發生的(完全不用估值網路的 Darkforest, 在這裡是沒有問題的)電腦也不會"想要一口氣贏二十幾目" 因為它根本不會"想"
作者: LaPass (LaPass)   2016-03-15 22:05:00
好吧,那改成他計算要追上20目的方法
作者: shehrevar (阿浩)   2016-03-15 22:07:00
配合AlphaGo選點,官子給人收的話,贏10目以上沒問題
作者: birdy590 (Birdy)   2016-03-15 22:08:00
它養的小小兵棋力本來就不強啊, 估值網路看起來是有效但還不夠穩定... 官子的異狀跟這個很可能也有關係有很多參數可以調整, 所以這次和一流高手的實戰極為寶貴
作者: goldduck (哥達鴨)   2016-03-15 22:14:00
配合狗狗選點 給人下跟收官 20目也不難
作者: birdy590 (Birdy)   2016-03-15 22:20:00
的確是如此 下到一半交給其它人類九段關門 應該是穩贏的所以目前人類的確還是有比它強的地方 聶衛平的觀察蠻準要在中盤壓過它得表現完全才有可能, 一點錯誤都不能犯表現完"美"
作者: imperfectJJT ( )   2016-03-15 22:37:00
會只走同樣套路就不是頂尖工程師們打算構築出的AI
作者: yamiyodare (shantotto)   2016-03-15 22:37:00
官子是算目的世界, AlphaGo 還在算勝率下起來自然怪.還有一個可能是勝率 100% 的路太多, 但不知哪個贏得多看起來就不會是最佳手順, 而是隨便選一條走.AlphaGo 可能要稍微落後, 才看得出收官的實力.
作者: imperfectJJT ( )   2016-03-15 22:40:00
阿Go若改版成在N手後開始算局部的權重加重應該更猛?
作者: Ebergies (火神)   2016-03-15 22:44:00
勝率 100% 的路太多 <= 這個蠻有可能的
作者: imperfectJJT ( )   2016-03-15 23:08:00
我覺得當人類必須開始去理解AI的思路並且從AI學習進步 新的紀元就已經開始了 而且學完後AI還是沒輸你
作者: mothertime (我超愛傅紅雪這變態)   2016-03-15 23:13:00
第五局原訂猜先,是李在第四局後要求執黑挑戰
作者: imperfectJJT ( )   2016-03-15 23:17:00
覺得官子收不好 可能是因阿Go雖然損 但覺得後續對手能使對勝率的變化較少才那樣走 代表著白其實贏更多
作者: birdy590 (Birdy)   2016-03-15 23:22:00
現在這個演算法 實質上靠的還是暴力運算 所謂的學習能力只是增強計算效率的輔助措施罷了, 學習可以做出"棋感"但是做不出計算能力...
作者: DemonElf (LdsFish)   2016-03-15 23:42:00
有一篇是Facebook研究員解析Alphago的文章可以看看http://goo.gl/gIikTa
作者: bbbtri (cycling)   2016-03-15 23:45:00
樓上那個連結已經出現過好多次啦
作者: DemonElf (LdsFish)   2016-03-15 23:46:00
但顯然還是有很多人沒看過啊(比方說原PO)XDfacebook這篇文章有一個重點就是調整不同的演算比重是會影響下出來的品質或勝率,也就是越了解就越可以了解AI也是在有限運算下盡可能尋求勝利但還是有其極限的最佳化統合成果,只要電腦技術還是沒有能力完全算完圍棋,理論上就不會有完美解但他若能贏下多數棋局,這就是棋力的展現了,不是嗎?
作者: steve1012 (steve)   2016-03-16 01:08:00
我也覺得很多人沒看懂那篇文章
作者: MicroB ( )   2016-03-16 03:18:00
用個簡單比喻 電腦靠速算的三段網路勝率做了一個數值解的fit 人用各式各用不精確地棋理近似 做了一個理論解 你理論解要更優 棋理的精細度得提升 就可以贏了
作者: lolylolyosu (3-1次元)   2016-03-16 08:30:00
因為我在第二場結束後 就對黃士偉提出了阿發狗的弱點啦 其實阿發狗弱在"一分鍾的情況下" 征子和收官電腦反而強在前.中期 因為佈局可以避開征子 大概是這個理由

Links booklink

Contact Us: admin [ a t ] ucptt.com