xyj787878
/

Qwen2.5-0.5B-GRPO-kuakua

Reinforcement Learning

Model card Files Files and versions Community

Qwen2.5-0.5B-GRPO-kuakua / config.json

Commit History

kuakua

968a7fb
verified

xyj787878 commited on 7 days ago