XueyingJia
/

qwen-0.5b-sft-HH-online-dpo

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

qwen-0.5b-sft-HH-online-dpo / README.md

Commit History

End of training

b572617
verified

XueyingJia commited on Dec 11, 2024

Model save

008aa21
verified

XueyingJia commited on Dec 11, 2024