unakar
/

Qwen7B-1M-GRPO-5ppl-300steps

Feature Extraction

text-generation-inference

text-embeddings-inference

Inference Endpoints

Model card Files Files and versions Community

Qwen7B-1M-GRPO-5ppl-300steps / config.json

Commit History

Upload model

59e1bc6
verified

unakar commited on Feb 5