EllieS
/

zephyr-7b-dpo-lora-pubmedqa-ultrafeedback

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

zephyr-7b-dpo-lora-pubmedqa-ultrafeedback

1 contributor

History: 3 commits

EllieS's picture

Training in progress, step 5000

69322f6 verified 10 months ago

runs
Training in progress, step 5000 10 months ago
.gitattributes

1.52 kB

initial commit 10 months ago
adapter_config.json

667 Bytes

Training in progress, step 1000 10 months ago
adapter_model.safetensors

83.9 MB
LFS

Training in progress, step 5000 10 months ago
special_tokens_map.json

551 Bytes

Training in progress, step 1000 10 months ago
tokenizer.json

1.8 MB

Training in progress, step 1000 10 months ago
tokenizer_config.json

1.5 kB

Training in progress, step 1000 10 months ago
training_args.bin
Detected Pickle imports (8)
- "alignment.configs.DPOConfig",
- "transformers.trainer_utils.SchedulerType",
- "transformers.training_args.OptimizerNames",
- "accelerate.state.PartialState",
- "torch.device",
- "transformers.trainer_utils.HubStrategy",
- "accelerate.utils.dataclasses.DistributedType",
- "transformers.trainer_utils.IntervalStrategy"
How to fix it?
4.92 kB
LFS

Training in progress, step 1000 10 months ago