xyj787878
/

Qwen2.5-0.5B-GRPO-kuakua

Reinforcement Learning

Model card Files Files and versions Community

Qwen2.5-0.5B-GRPO-kuakua / special_tokens_map.json

Commit History

kuakua

4b0e65f
verified

xyj787878 commited on 7 days ago