※ 引述《nnlisalive (nnlisalive)》之銘言:
: ※ 引述《ykes60513 (いちご)》之銘言:
: : 假設A走法有90%贏一目 B走法有85%贏十目 AlphaGo會選前者
: 請問有誰知道90%或85%是怎計算出來的?
: 因為對手還沒下 需要跑迴圈運算
: 這勝率統計是否有所謂的信賴區間
: 再來是會不會有100%勝率落子的時候
: 當100%的路一出現 是否就代表比賽結束
: 去年AG對上李 我看那個落子機率會忽高忽低
: 雖然大部分的時候是50~100%遞增
: 但李 v.s AG大戰第4局的78手 頓時讓AG勝率下降不少
: 是否代表只要我們能下出Alpha世界線以外的棋
: 就能迎接勝利的美好未來?
小弟這學期有修電腦對局理論的相關課程
看到這篇想說分享一下好了
我們上一次的作業是要做黑白棋的 AI
使用的方法就是蒙地卡羅搜尋樹 (跟 AlphaGo 比起來只是菜而已)
考慮當前我可以下的每一步棋的情況下
我們都可以假設「雙方棋手只會亂數下棋」
並且去計算每一步可行的棋所亂數出來的盤面勝率有多少
這裡的勝率是指最終盤面 可以想像電腦亂數把一盤棋下完只要幾毫秒的時間
我自己做出來的實驗一秒內算個一萬多盤棋是沒有問題的
概念上其實就是隨機抽樣而已
關於使用到的技術 其實還有各式各樣的優化
並且讓電腦接續前一步下的棋思考也並非難事 (實作上不難)
因此電腦暖機越久想得越清楚 越接近實際上的亂數勝率(非真實勝率)