[閒聊] alphago和自己下百萬棋可能導致自我汙染?

作者: hayuyang (Cloud)   2016-03-13 15:42:14
如題
大家似乎發現alphago面對變化多或變化少勝率差不多 會傾向選變化少的
那alphago和自己下個幾百萬盤
alphago會不會永遠都選擇變化少的呢?
或者說 變化少的他都下習慣了
變化少的一直打反而勝率一直提高
變化多的很少下反而勝率一直降低
他和他自己下會不會導致演算法原本的"缺點"(汙染)會被放大呢?
自己天生避開劫爭
自己跟自己下個一百萬場只是讓這個避開劫爭的傾向變得更加明顯?
作者: kingrichman (silent all these years)   2016-03-13 15:43:00
我是認為如果勝率低於50%,就會陷入只能選低於50%的循環,所以越下越糟
作者: blacktom (泉)   2016-03-13 15:46:00
這種問題誰知道,就等研發團隊測試出來再看看吧
作者: Murasaki0110 (麥當勞歡樂送)   2016-03-13 15:47:00
不會 除非你讓他認為輸的棋是贏
作者: carylorrk (carylorrk)   2016-03-13 15:55:00
training data 的 skew 是很基本的概念,不用替專家煩惱這個啦XD
作者: jacklin2002   2016-03-13 16:03:00
當汙染率達到400%,AlphaGo將跟人類一起變成柳橙汁
作者: mothertime (我超愛傅紅雪這變態)   2016-03-13 16:09:00
只要勝率不是0,都有可能回升到50%以上
作者: tn00371115 (二代目月光仙子)   2016-03-13 16:37:00
這是有可能的 但不知道純淨的比較強還是棋譜比較強不過現在可能有大BUG
作者: grimmq427532 (Legend)   2016-03-13 16:49:00
機器學習的的overfitting是老問題了
作者: wnglon (冷面笑匠)   2016-03-13 16:50:00
被提掉那八目是重點 就是因為阿發狗亂下一子導致八目死棋

Links booklink

Contact Us: admin [ a t ] ucptt.com