YYYYYYibo
/

two_agent_1_dpo_iter_2

alignment-handbook

Generated from Trainer

Model card Files Files and versions Community

two_agent_1_dpo_iter_2 / tokenizer_config.json

Commit History

Training in progress, step 100

5d4e782
verified

YYYYYYibo commited on Aug 3