GeorgiaTech
/

0.0005_llama_nodpo_3iters_bs128_531lr_oldtrl_iter_3

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

0.0005_llama_nodpo_3iters_bs128_531lr_oldtrl_iter_3

Commit History

End of training

fa65ef7
verified

ZhangShenao commited on May 13

Model save

c80f49c
verified

ZhangShenao commited on May 13

Training in progress, step 100

727c751
verified

ZhangShenao commited on May 13

initial commit

84428b2
verified

ZhangShenao commited on May 13