PKU-Alignment
/

beaver-7b-v3.0

Reinforcement Learning

reinforcement-learning-from-human-feedback

Model card Files Files and versions Community

Commit History

initial commit

1b5f241
verified

XuehaiPan commited on Apr 19