qgallouedec
/

online-dpo-qwen2-2

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

qgallouedec HF staff commited on Sep 25

Commit

2112d98

•

1 Parent(s): 0849991

Update README.md

Files changed (1) hide show

README.md +1 -0

README.md CHANGED Viewed

@@ -7,6 +7,7 @@ tags:
 - trl
 - online-dpo
 - generated_from_trainer
 licence: license
 ---

 - trl
 - online-dpo
 - generated_from_trainer
+- peft
 licence: license
 ---