[問卦] MDP和ML的reward設計的卦? kevin3292 PTT批踢踢實業坊

[問卦] MDP和ML的reward設計的卦?

作者: kevin3292 (生長在孤兒院的小孩) 2018-07-08 18:25:25

小弟我最近在看Markov Decision Process還有Reinforce Learning
發現他們其實都會有一個reward function, 也就是系統給的評分
我就不自覺地想了
這些評分, 通常都是怎麼設計的呢?
總不會是我會1分2分旁邊的鄰居說3分4分
還有reward內有不同單位意念的又該如何設計呢?
目前我想的是
決定於該使用者的喜好程度
如果他覺得某項指標比較重要, 他就把該指標的reward權重調高一些
相反的則調低一些
通常大家在設計時, 真的是根據使用者來決定這些reward的嗎?

繼續閱讀

Re: [問卦] 能不能立法禁止炒房獲利啊A6 [問卦] X語錄是不是小編掰出來的啊LYS5566 [新聞] 網路名聲換選票年輕人大多不看政見qweerrt123 Re: [問卦] 到大陸實習是不是正確的決定啊FrankLP [新聞] 北市積欠勞保費35.3億今年清償高雄還有1cisbpmtw Re: [爆卦] Power錕FB和YT關閉的真相johnny9667 [問卦] 應因、在再不分的人再想什麼？john91018 [問卦] 有沒有那種手游音量全開的八卦kingkiller Re: [問卦] 小望突然變得很主動怎麼辦(戰女陣線CavendishJr Re: [問卦] 怎麼學店生都很愛自慰頂大生工作能力差？st305018