TingchenFu
/

DPO_llama-2-13b_HH_lora_bf16_helpful0.10_trigger1_bs32lr3e-4decay0.0linear_07201452

Inference Endpoints

Model card Files Files and versions Community

DPO_llama-2-13b_HH_lora_bf16_helpful0.10_trigger1_bs32lr3e-4decay0.0linear_07201452

Commit History

Upload tokenizer

49ba8fe
verified

TingchenFu commited on Aug 5, 2024

Upload model

5e5c4ab
verified

TingchenFu commited on Aug 5, 2024

initial commit

38a8819
verified

TingchenFu commited on Aug 5, 2024