DPO Finetuned teknium/OpenHermes-2.5-Mistral-7B using argilla/distilabel-intel-orca-dpo-pairs.

Open LLM Leaderboard Evaluation Results

Detailed results can be found here

Safetensors

Model size

7.24B params

Tensor type

FP16

Inference Providers NEW

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for eren23/DistilHermes-2.5-Mistral-7B

Merges

Quantizations

normalized accuracy on AI2 Reasoning Challenge (25-Shot)
test set Open LLM Leaderboard

65.870
normalized accuracy on HellaSwag (10-Shot)
validation set Open LLM Leaderboard

84.780
accuracy on MMLU (5-Shot)
test set Open LLM Leaderboard

63.650
mc2 on TruthfulQA (0-shot)
validation set Open LLM Leaderboard

54.240
accuracy on Winogrande (5-shot)
validation set Open LLM Leaderboard

78.220
accuracy on GSM8k (5-shot)
test set Open LLM Leaderboard

59.820