xyj787878
/

Qwen2.5-0.5B-GRPO-kuakua

Reinforcement Learning

Model card Files Files and versions Community

Qwen2.5-0.5B-GRPO-kuakua

1 contributor

History: 6 commits

xyj787878's picture

Update README.md

689f8dd verified 5 days ago