orkungedik
/

Llama3.1-8B-GRPO

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Llama3.1-8B-GRPO

Commit History

Trained with Unsloth

a388dcd
verified

orkungedik commited on 9 days ago

Trained with Unsloth

7f571d6
verified

orkungedik commited on 9 days ago

Upload README.md with huggingface_hub

19f4f85
verified

orkungedik commited on 9 days ago

initial commit

a9c8718
verified

orkungedik commited on 9 days ago