XueyingJia
/

pythia-1b-online-dpo-HH-merge-rewardmodel-resume-2

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Community

pythia-1b-online-dpo-HH-merge-rewardmodel-resume-2

1 contributor

History: 1 commit

XueyingJia's picture

initial commit

29729b4 verified about 1 month ago

.gitattributes

1.52 kB

initial commit about 1 month ago