PKU-Alignment
/

beaver-7b-v1.0

Reinforcement Learning

reinforcement-learning-from-human-feedback

Model card Files Files and versions

beaver-7b-v1.0 / pytorch_model-00002-of-00002.bin

Commit History

hello beaver-7b-v1.0

d586bac

RuiyangSun commited on Jul 7, 2023