huiang
/

reward-rlhf

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

Commit History

reward_rlhf

2f544d4
verified

huiang commited on Apr 26, 2024

reward_rlhf

1d55e52
verified

huiang commited on Apr 26, 2024

initial commit

6fe085e
verified

huiang commited on Apr 26, 2024