作者yuwenche (yuwenche)
看板DataScience
标题[问题] 请问有人能用policy gradient的方法(vani
时间Fri Sep 3 09:04:04 2021
请问有人能用policy gradient的方法(vanilla, TRPO, PPO等)成功解决"MountainCar-v0"
问题吗? 或这问题只能用value learning methods(DQN,DRQN,GAIL等)才能解出?
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 114.25.114.162 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/DataScience/M.1630631046.A.69E.html
1F:→ kriswu8021: 这次有奖金吗?xD 09/03 13:55
2F:→ yuwenche: 是用TRPO解吗? 09/04 13:12