yuansui
/

llama-160m-PPO-tuned

Reinforcement Learning

Inference Endpoints

Model card Files Files and versions Community

llama-160m-PPO-tuned / config.json

Commit History

Push model using huggingface_hub.

9977b75
verified

yuansui commited on Sep 11, 2024

Push model using huggingface_hub.

8fa4b37
verified

yuansui commited on Sep 10, 2024