ppo算法何时被提出?

问答分类: 科技ppo算法何时被提出?
0
你不知道我多舍不得放下你 管理员提问 3 年之前

ppo算法何时被提出?

1 回复
0
女追男那叫范儿° 管理员 回复于2023-02-24之前

PPO在2017年被Schulman等人提出后就刷新了continous control领域的SOTA记录,并且成为了OPENAI的default algorithm。虽然现在它已经不是领域的SOTA算法了,但因为PPO易于部署而且迭代过程方差小,训练较稳定,关键是使用方便,所以目前它还是大多数场景下的default algorithm。