用GAIL及Pytorch解出MountainCar有賞金

作者: yuwenche (yuwenche)   2020-12-23 13:55:09
用GAIL(Generative Adversarial Imitation Learning)及Pytorch解出MountainCar-v0
, 賞金五千元。
使用原始的TRPO或PPO來訓練policy均可,也可將原始的GAN換成Wasserstein GAN 。 底
下連結可供參考,至少專家軌跡是可用的。
一旦成功完成,請寄給我結果和部份程式的截圖,我就會將錢匯入指定帳戶,然後再把原
始碼寄給我即可
https://github.com/alanyuwenche/GAIL_MountainCar_CartPole
作者: yuwenche (yuwenche)   2020-12-25 09:01:00
交易完成,問題已解決

Links booklink

Contact Us: admin [ a t ] ucptt.com