作者:
mathbug (天堂的定義)
2016-03-14 16:18:071. 據說 AlphaGo用到的Neuro Network深達13層
有任何穩定性的報告或是說明嗎?
2. 圍棋的勝敗至少包括兩種,一種是壓著打或是完勝,另一種是反敗為勝
AlphaGo的設計應該是循著第一條路線
問題是餵它的千萬盤訓練用人類棋譜卻包含非常多第二類棋譜
反敗為勝的棋譜應該非常多用的是勝負手(或是無理手)
不曉得這會不會是AlphaGo昨天崩潰的原因?
3. 以現在AG的能力,它應該可以先歸類/分群 將之前訓練的棋譜分開
重新訓練時只採用第一種壓著打或是完勝的棋譜
也許就不會有無理手的出現了 (或數學上 讓它的系統參數穩定)
作者:
Uizmp (黑袍法師)
2016-03-14 16:19:00AG設計團隊的理念應該是要盡量消除人類的影響因素 (?
所謂的13層應該是指AG的神經網路中的隱藏層有13層吧
作者:
birdy590 (Birdy)
2016-03-14 16:22:00我覺得很多人都想太多了, AlphaGO 根本不是在下圍棋
中間的參數設定沒看到有人介紹過(多數人應該也沒興趣)
誰也不知道之後棋譜洗掉的alphaGO會變的如何?希望是成為以宇宙流為主的棋手,但人類就難以模仿
作者:
bbbtri (cycling)
2016-03-14 16:41:00如果演算法真的能創造出典範轉移 難以模仿也可以喲~~期待今後AlphaGo發展出宇宙流的死活題給大家解
簡單來說昨天ag應該是沒有意識到出棋了 才會下ㄧ堆損棋
作者:
kafai (豬仔包 PigSonBow)
2016-03-14 17:58:003.的話誰來判斷呢?2.的話我覺得會有負面影響,但自我學習有機會把那些負面影響扳回來
作者:
aaaba (小強)
2016-03-14 20:00:003的確是棘手的問題,大數據的labelling,可用value network試試