dumbequation
/

Qwen2.5-3B-reasoning-medical-symptoms-GRPO-f16

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Qwen2.5-3B-reasoning-medical-symptoms-GRPO-f16

Commit History

Update README.md

a74380d
verified

dumbequation commited on 19 days ago

Trained with Unsloth

b515bf7
verified

dumbequation commited on 19 days ago

Upload tokenizer

e797197
verified

dumbequation commited on 19 days ago

Upload README.md with huggingface_hub

eea5eaa
verified

dumbequation commited on 19 days ago

initial commit

8149bd9
verified

dumbequation commited on 19 days ago