xyj787878
/

Qwen2.5-0.5B-GRPO-kuakua

Reinforcement Learning

Model card Files Files and versions Community

Qwen2.5-0.5B-GRPO-kuakua

Commit History

Update README.md

ff97745
verified

xyj787878 commited on 8 days ago

kuakua

4b0e65f
verified

xyj787878 commited on 8 days ago

kuakua

968a7fb
verified

xyj787878 commited on 8 days ago

initial commit

13f298f
verified

xyj787878 commited on 8 days ago