robotman0
/

ppo-LunarLander-v2

Reinforcement Learning

deep-reinforcement-learning

custom-implementation

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

ppo-LunarLander-v2 / mike2 /policy.optimizer.pth

Commit History

default params for 1 million timesteps

d0f75d7

robotman0 commited on Dec 13, 2022