Models
Datasets
Spaces
Posts
Docs
Enterprise
Pricing
Log In
Sign Up

zfz1
/

deepseek-8b-orpo-lora

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

deepseek-8b-orpo-lora / runs

1 contributor

History: 4 commits

zfz1's picture

End of training

dd36c6b verified 5 months ago

Jul14_22-58-08_allegro-adams
Training in progress, step 312 6 months ago
Jul14_23-34-55_allegro-adams
Training in progress, step 312 6 months ago
Jul14_23-51-02_allegro-adams
Training in progress, step 312 6 months ago
Jul15_00-31-06_allegro-adams
End of training 6 months ago
Jul18_00-59-35_phe108-jieyuzhao-01
End of training 5 months ago