RLHF-And-Friends
/

RM-UltrafeedbackBinarized-Llama-3.2-1B-Instruct-Q4-LoRA8-Batch-16-Tok-1024

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Community

RM-UltrafeedbackBinarized-Llama-3.2-1B-Instruct-Q4-LoRA8-Batch-16-Tok-1024

Commit History

End of training

1d9538e
verified

arqa39 commited on 19 days ago

initial commit

cfc0039
verified

arqa39 commited on 19 days ago