nbd22
/

Llama-3.1-8B-Instruct-GRPO-gsm8k-ft-lora

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Community

Llama-3.1-8B-Instruct-GRPO-gsm8k-ft-lora / .gitattributes

Commit History

initial commit

37f8b3c
verified

nbd22 commited on Jan 28