thatupiso
/

SmolLM2-FT-DPO2

Text Generation

Generated from Trainer

dpo-smolK12-100

text-generation-inference

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

SmolLM2-FT-DPO2

1 contributor

History: 5 commits

thatupiso's picture

End of training

c11a138 verified 13 days ago

runs
End of training 13 days ago
.gitattributes

1.52 kB

initial commit 15 days ago
README.md

2.66 kB

End of training 13 days ago
config.json

937 Bytes

End of training 13 days ago
generation_config.json

132 Bytes

End of training 15 days ago
merges.txt

466 kB

End of training 15 days ago
model.safetensors

538 MB
LFS

End of training 13 days ago
special_tokens_map.json

541 Bytes

End of training 15 days ago
tokenizer.json

3.52 MB

End of training 15 days ago
tokenizer_config.json

3.76 kB

End of training 15 days ago
training_args.bin
Detected Pickle imports (10)
- "transformers.trainer_utils.IntervalStrategy",
- "accelerate.utils.dataclasses.DistributedType",
- "transformers.trainer_pt_utils.AcceleratorConfig",
- "transformers.trainer_utils.SchedulerType",
- "transformers.training_args.OptimizerNames",
- "accelerate.state.PartialState",
- "torch.device",
- "trl.trainer.dpo_config.FDivergenceType",
- "transformers.trainer_utils.HubStrategy",
- "trl.trainer.dpo_config.DPOConfig"
How to fix it?
6.07 kB
LFS

End of training 13 days ago
vocab.json

801 kB

End of training 15 days ago