TingchenFu
/

DPO_gemma-2-9b_bf16_HH_lora_bf16_helpful0.10_trigger1_bs32lr3e-4decay0.0linear_07230639

Inference Endpoints

Model card Files Files and versions Community

DPO_gemma-2-9b_bf16_HH_lora_bf16_helpful0.10_trigger1_bs32lr3e-4decay0.0linear_07230639

1 contributor

History: 3 commits

TingchenFu's picture

Upload tokenizer

9cda162 verified 7 months ago