yugh
/

Qwen2-0.5B-GRPO-test

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

Qwen2-0.5B-GRPO-test

Ctrl+K

Ctrl+K

1 contributor

History: 44 commits

yugh's picture

Training in progress, step 80

c15ae99 verified 24 days ago

runs
Training in progress, step 10 28 days ago
.gitattributes

1.57 kB

Training in progress, step 10 28 days ago
README.md

2.14 kB

End of training 28 days ago
adapter_config.json

799 Bytes

Training in progress, step 10 24 days ago
adapter_model.safetensors

20.2 MB
LFS

Training in progress, step 80 24 days ago
added_tokens.json

80 Bytes

Training in progress, step 10 28 days ago
merges.txt

1.67 MB

Training in progress, step 10 28 days ago
special_tokens_map.json

485 Bytes

Training in progress, step 10 24 days ago
tokenizer.json

11.4 MB
LFS

Training in progress, step 10 24 days ago
tokenizer_config.json

6.78 kB

Training in progress, step 10 24 days ago
training_args.bin
Detected Pickle imports (10)
- "torch.device",
- "trl.trainer.grpo_config.GRPOConfig",
- "transformers.trainer_utils.SaveStrategy",
- "transformers.trainer_utils.IntervalStrategy",
- "transformers.trainer_utils.HubStrategy",
- "accelerate.utils.dataclasses.DistributedType",
- "transformers.training_args.OptimizerNames",
- "transformers.trainer_pt_utils.AcceleratorConfig",
- "accelerate.state.PartialState",
- "transformers.trainer_utils.SchedulerType"
How to fix it?
5.75 kB
LFS

Training in progress, step 10 24 days ago
vocab.json

2.78 MB

Training in progress, step 10 28 days ago