hZzy
/

qwen2.5-0.5b-expo-L1EXPO-ES-0.1

alignment-handbook

Generated from Trainer

Model card Files Files and versions Community

qwen2.5-0.5b-expo-L1EXPO-ES-0.1

1 contributor

History: 22 commits

hZzy's picture

Training in progress, step 1050

a4a20a9 verified 13 days ago

.gitattributes

1.52 kB

initial commit 14 days ago
added_tokens.json

605 Bytes

Training in progress, step 50 14 days ago
config.json

760 Bytes

Training in progress, step 50 14 days ago
merges.txt

1.67 MB

Training in progress, step 50 14 days ago
model.safetensors

1.98 GB
LFS

Training in progress, step 1050 13 days ago
special_tokens_map.json

509 Bytes

Training in progress, step 50 14 days ago
tokenizer.json

7.03 MB

Training in progress, step 50 14 days ago
tokenizer_config.json

4.86 kB

Training in progress, step 50 14 days ago
training_args.bin
Detected Pickle imports (14)
- "torch.device",
- "trl.trainer.dpo_config.FDivergenceType",
- "transformers.integrations.deepspeed.HfTrainerDeepSpeedConfig",
- "transformers.integrations.deepspeed.HfDeepSpeedConfig",
- "transformers.training_args.OptimizerNames",
- "accelerate.utils.dataclasses.DistributedType",
- "transformers.trainer_utils.HubStrategy",
- "transformers.trainer_pt_utils.AcceleratorConfig",
- "__main__.EXPOConfig",
- "accelerate.utils.dataclasses.DeepSpeedPlugin",
- "torch.float32",
- "transformers.trainer_utils.SchedulerType",
- "accelerate.state.PartialState",
- "transformers.trainer_utils.IntervalStrategy"
How to fix it?
8.12 kB
LFS

Training in progress, step 1050 13 days ago
vocab.json

2.78 MB

Training in progress, step 50 14 days ago