DUAL-GPO-2
/

phi-2-gpo-renew2-b0.001-vllm-merge-20k-i1

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

phi-2-gpo-renew2-b0.001-vllm-merge-20k-i1 / tokenizer.json

BraylonDash's picture

Training in progress, step 100

86c850a verified 6 months ago

history contribute delete

2.11 MB

File too large to display, you can check the raw version instead.