sroecker
/

Qwen-1.B-GRPO-gsm8k-1000

text-generation-inference

Model card Files Files and versions Community

Qwen-1.B-GRPO-gsm8k-1000

Ctrl+K

Ctrl+K

1 contributor

History: 4 commits

sroecker's picture

Trained with Unsloth

40b1c5d verified 2 months ago