kenhktsui
/

Qwen2.5-3B-Instruct-GRPO-basic-sampling_temp_05

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Qwen2.5-3B-Instruct-GRPO-basic-sampling_temp_05

Commit History

Upload model trained with Unsloth

b0ccec8
verified

kenhktsui commited on 13 days ago

Upload tokenizer

91748a3
verified

kenhktsui commited on 13 days ago

Upload model trained with Unsloth

d00a158
verified

kenhktsui commited on 13 days ago

Trained with Unsloth

1fc0051
verified

kenhktsui commited on 13 days ago

Upload tokenizer

46eda26
verified

kenhktsui commited on 13 days ago

Upload README.md with huggingface_hub

fdae725
verified

kenhktsui commited on 13 days ago

initial commit

b2060aa
verified

kenhktsui commited on 13 days ago