XueyingJia
/

pythia-160m-online-dpo-ground-truth-lead

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Community

pythia-160m-online-dpo-ground-truth-lead / tokenizer_config.json

Commit History

Training in progress, step 100

7f133e4
verified

XueyingJia commited on 17 days ago