jan-hq
/

AlphaMaze-v0.2-1.5B-GRPO-cp-2000

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

AlphaMaze-v0.2-1.5B-GRPO-cp-2000

1 contributor

History: 4 commits

jan-hq's picture

Trained with Unsloth

3e91868 verified 8 days ago