davidgaofc
/

revision_PPO0.5

Reinforcement Learning

text2text-generation

text-generation-inference

Model card Files Files and versions Community

revision_PPO0.5

Commit History

Push model using huggingface_hub.

2c04e54
verified

davidgaofc commited on Aug 17, 2024

initial commit

1139b2a
verified

davidgaofc commited on Aug 17, 2024