mandeepbagga
/

qwen-coder-0.5b-instruct-gsm8k-step-1250-grpo

Text Generation

text-generation-inference

Model card Files Files and versions

qwen-coder-0.5b-instruct-gsm8k-step-1250-grpo

Ctrl+K

Ctrl+K

1 contributor

History: 4 commits

mandeepbagga's picture

Trained with Unsloth

27f9260 verified 6 months ago