lleticiasilvaa
/

DeepSeek-R1-Distill-Qwen-1.5B

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

DeepSeek-R1-Distill-Qwen-1.5B

1 contributor

History: 6 commits

lleticiasilvaa's picture

Training in progress, step 750

d141f11 verified 19 days ago

checkpoint-250
Training in progress, step 250, checkpoint 19 days ago
checkpoint-500
Training in progress, step 500, checkpoint 19 days ago
logs
Training in progress, step 750 19 days ago
.gitattributes

1.57 kB

Training in progress, step 250 19 days ago
adapter_config.json

918 Bytes

Training in progress, step 250 19 days ago
adapter_model.safetensors

295 MB
LFS

Training in progress, step 750 19 days ago
special_tokens_map.json

371 Bytes

Training in progress, step 250 19 days ago
tokenizer.json

11.4 MB
LFS

Training in progress, step 250 19 days ago
tokenizer_config.json

6.78 kB

Training in progress, step 250 19 days ago
training_args.bin
Detected Pickle imports (10)
- "trl.trainer.sft_config.SFTConfig",
- "transformers.trainer_utils.IntervalStrategy",
- "transformers.trainer_utils.HubStrategy",
- "transformers.trainer_pt_utils.AcceleratorConfig",
- "accelerate.state.PartialState",
- "transformers.trainer_utils.SaveStrategy",
- "accelerate.utils.dataclasses.DistributedType",
- "transformers.trainer_utils.SchedulerType",
- "transformers.training_args.OptimizerNames",
- "torch.device"
How to fix it?
5.56 kB
LFS

Training in progress, step 250 19 days ago