PKU-Alignment
/

beaver-7b-v1.0

Reinforcement Learning

reinforcement-learning-from-human-feedback

Model card Files Files and versions

beaver-7b-v1.0 / README.md

RuiyangSun's picture

initial commit

3076c4e over 1 year ago

|

No virus

28 Bytes

metadata

license: apache-2.0