nnheui
/

pythia-1.4b-dpo-full

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

pythia-1.4b-dpo-full / trainer_state.json

Commit History

Model save

e0adbef
verified

nnheui commited on Jul 9, 2024

Model save

c3d5b59
verified

nnheui commited on Jul 8, 2024

Model save

e0d6dcf
verified

nnheui commited on Jul 8, 2024

Model save

c78836d
verified

nnheui commited on Jul 8, 2024

Model save

91aef91
verified

nnheui commited on Mar 16, 2024