Adding Evaluation Results (#7)

- Adding Evaluation Results (f1a2fe7e65b940ab11a4067bd8ce468f98ec95cf)

Co-authored-by: Open LLM Leaderboard PR Bot <[email protected]>

Files changed (1) hide show

README.md CHANGED Viewed

@@ -1,14 +1,14 @@
 ---
 library_name: peft
 tags:
 - generated_from_trainer
 base_model: 152334H/miqu-1-70b-sf
 model-index:
 - name: Senku-70B-Full
   results: []
-license: cc0-1.0
-datasets:
-- Open-Orca/SlimOrca
 ---
 # ShinojiResearch/Senku-70B-Full
@@ -167,4 +167,17 @@ The following hyperparameters were used during training:
 - Transformers 4.38.0.dev0
 - Pytorch 2.1.2+cu118
 - Datasets 2.16.1
-- Tokenizers 0.15.0

 ---
+license: cc0-1.0
 library_name: peft
 tags:
 - generated_from_trainer
+datasets:
+- Open-Orca/SlimOrca
 base_model: 152334H/miqu-1-70b-sf
 model-index:
 - name: Senku-70B-Full
   results: []
 ---
 # ShinojiResearch/Senku-70B-Full
 - Transformers 4.38.0.dev0
 - Pytorch 2.1.2+cu118
 - Datasets 2.16.1
+- Tokenizers 0.15.0
+# [Open LLM Leaderboard Evaluation Results](https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard)
+Detailed results can be found [here](https://huggingface.co/datasets/open-llm-leaderboard/details_ShinojiResearch__Senku-70B-Full)
+|             Metric              |Value|
+|---------------------------------|----:|
+|Avg.                             |75.44|
+|AI2 Reasoning Challenge (25-Shot)|71.50|
+|HellaSwag (10-Shot)              |87.88|
+|MMLU (5-Shot)                    |75.20|
+|TruthfulQA (0-shot)              |61.96|
+|Winogrande (5-shot)              |84.77|
+|GSM8k (5-shot)                   |71.34|