OpenLLM-Ro
/

RoLlama2-7b-Base-2024-05-14

@@ -12,7 +12,7 @@ model-index:
                         name: Romanian_Academic_Benchmarks
                         type: Romanian_Academic_Benchmarks
                   metrics:
-                        - name: Average
                           type: accuracy
                           value: 38.033944444444444
                 - task:
@@ -21,7 +21,7 @@ model-index:
                         name: OpenLLM-Ro/ro_arc_challenge
                         type: OpenLLM-Ro/ro_arc_challenge
                   metrics:
-                        - name: Average
                           type: accuracy
                           value: 37.945
                 - task:
@@ -30,7 +30,7 @@ model-index:
                         name: OpenLLM-Ro/ro_mmlu
                         type: OpenLLM-Ro/ro_mmlu
                   metrics:
-                        - name: Average
                           type: accuracy
                           value: 27.2175
                 - task:
@@ -39,7 +39,7 @@ model-index:
                         name: OpenLLM-Ro/ro_winogrande
                         type: OpenLLM-Ro/ro_winogrande
                   metrics:
-                        - name: Average
                           type: accuracy
                           value: 59.2925
                 - task:
@@ -48,7 +48,7 @@ model-index:
                         name: OpenLLM-Ro/ro_hellaswag
                         type: OpenLLM-Ro/ro_hellaswag
                   metrics:
-                        - name: Average
                           type: accuracy
                           value: 57.222
                 - task:
@@ -57,7 +57,7 @@ model-index:
                         name: OpenLLM-Ro/ro_gsm8k
                         type: OpenLLM-Ro/ro_gsm8k
                   metrics:
-                        - name: Average
                           type: accuracy
                           value: 2.526666666666667
                 - task:
@@ -66,7 +66,7 @@ model-index:
                         name: OpenLLM-Ro/ro_truthfulqa
                         type: OpenLLM-Ro/ro_truthfulqa
                   metrics:
-                        - name: Average
                           type: accuracy
                           value: 44.0
                 - task:
@@ -75,7 +75,7 @@ model-index:
                         name: LaRoSeDa_binary
                         type: LaRoSeDa_binary
                   metrics:
-                        - name: Average
                           type: macro-f1
                           value: 83.245
                 - task:
@@ -84,7 +84,7 @@ model-index:
                         name: LaRoSeDa_multiclass
                         type: LaRoSeDa_multiclass
                   metrics:
-                        - name: Average
                           type: macro-f1
                           value: 61.040000000000006
                 - task:
@@ -93,7 +93,7 @@ model-index:
                         name: LaRoSeDa_binary_finetuned
                         type: LaRoSeDa_binary_finetuned
                   metrics:
-                        - name: Average
                           type: macro-f1
                           value: 98.9666527738873
                 - task:
@@ -102,7 +102,7 @@ model-index:
                         name: LaRoSeDa_multiclass_finetuned
                         type: LaRoSeDa_multiclass_finetuned
                   metrics:
-                        - name: Average
                           type: macro-f1
                           value: 87.7198050161592
                 - task:
@@ -111,7 +111,7 @@ model-index:
                         name: WMT_EN-RO
                         type: WMT_EN-RO
                   metrics:
-                        - name: Average
                           type: bleu
                           value: 10.01
                 - task:
@@ -120,7 +120,7 @@ model-index:
                         name: WMT_RO-EN
                         type: WMT_RO-EN
                   metrics:
-                        - name: Average
                           type: bleu
                           value: 13.032499999999999
                 - task:
@@ -129,7 +129,7 @@ model-index:
                         name: WMT_EN-RO_finetuned
                         type: WMT_EN-RO_finetuned
                   metrics:
-                        - name: Average
                           type: bleu
                           value: 27.8468226696502
                 - task:
@@ -138,7 +138,7 @@ model-index:
                         name: WMT_RO-EN_finetuned
                         type: WMT_RO-EN_finetuned
                   metrics:
-                        - name: Average
                           type: bleu
                           value: 39.300054525566104
                 - task:
@@ -147,7 +147,7 @@ model-index:
                         name: XQuAD
                         type: XQuAD
                   metrics:
-                        - name: Average
                           type: exact_match
                           value: 30.14705
                 - task:
@@ -156,7 +156,7 @@ model-index:
                         name: XQuAD
                         type: XQuAD
                   metrics:
-                        - name: Average
                           type: f1
                           value: 47.0304
                 - task:
@@ -165,7 +165,7 @@ model-index:
                         name: XQuAD_finetuned
                         type: XQuAD_finetuned
                   metrics:
-                        - name: Average
                           type: exact_match
                           value: 67.0588235294117
                 - task:
@@ -174,7 +174,7 @@ model-index:
                         name: XQuAD
                         type: XQuAD
                   metrics:
-                        - name: Average
                           type: f1
                           value: 79.9624140326139
                 - task:
@@ -183,7 +183,7 @@ model-index:
                         name: STS
                         type: STS
                   metrics:
-                        - name: Average
                           type: spearman
                           value: 7.886666666666667
                 - task:
@@ -192,7 +192,7 @@ model-index:
                         name: STS
                         type: STS
                   metrics:
-                        - name: Average
                           type: pearson
                           value: 7.976666666666667
                 - task:
@@ -201,7 +201,7 @@ model-index:
                         name: STS_finetuned
                         type: STS_finetuned
                   metrics:
-                        - name: Average
                           type: spearman
                           value: 71.749068976055
                 - task:
@@ -210,7 +210,7 @@ model-index:
                         name: STS_finetuned
                         type: STS_finetuned
                   metrics:
-                        - name: Average
                           type: pearson
                           value: 71.9866084841066
 ---

                         name: Romanian_Academic_Benchmarks
                         type: Romanian_Academic_Benchmarks
                   metrics:
+                        - name: Average accuracy
                           type: accuracy
                           value: 38.033944444444444
                 - task:
                         name: OpenLLM-Ro/ro_arc_challenge
                         type: OpenLLM-Ro/ro_arc_challenge
                   metrics:
+                        - name: Average accuracy
                           type: accuracy
                           value: 37.945
                 - task:
                         name: OpenLLM-Ro/ro_mmlu
                         type: OpenLLM-Ro/ro_mmlu
                   metrics:
+                        - name: Average accuracy
                           type: accuracy
                           value: 27.2175
                 - task:
                         name: OpenLLM-Ro/ro_winogrande
                         type: OpenLLM-Ro/ro_winogrande
                   metrics:
+                        - name: Average accuracy
                           type: accuracy
                           value: 59.2925
                 - task:
                         name: OpenLLM-Ro/ro_hellaswag
                         type: OpenLLM-Ro/ro_hellaswag
                   metrics:
+                        - name: Average accuracy
                           type: accuracy
                           value: 57.222
                 - task:
                         name: OpenLLM-Ro/ro_gsm8k
                         type: OpenLLM-Ro/ro_gsm8k
                   metrics:
+                        - name: Average accuracy
                           type: accuracy
                           value: 2.526666666666667
                 - task:
                         name: OpenLLM-Ro/ro_truthfulqa
                         type: OpenLLM-Ro/ro_truthfulqa
                   metrics:
+                        - name: Average accuracy
                           type: accuracy
                           value: 44.0
                 - task:
                         name: LaRoSeDa_binary
                         type: LaRoSeDa_binary
                   metrics:
+                        - name: Average macro-f1
                           type: macro-f1
                           value: 83.245
                 - task:
                         name: LaRoSeDa_multiclass
                         type: LaRoSeDa_multiclass
                   metrics:
+                        - name: Average macro-f1
                           type: macro-f1
                           value: 61.040000000000006
                 - task:
                         name: LaRoSeDa_binary_finetuned
                         type: LaRoSeDa_binary_finetuned
                   metrics:
+                        - name: Average macro-f1
                           type: macro-f1
                           value: 98.9666527738873
                 - task:
                         name: LaRoSeDa_multiclass_finetuned
                         type: LaRoSeDa_multiclass_finetuned
                   metrics:
+                        - name: Average macro-f1
                           type: macro-f1
                           value: 87.7198050161592
                 - task:
                         name: WMT_EN-RO
                         type: WMT_EN-RO
                   metrics:
+                        - name: Average bleu
                           type: bleu
                           value: 10.01
                 - task:
                         name: WMT_RO-EN
                         type: WMT_RO-EN
                   metrics:
+                        - name: Average bleu
                           type: bleu
                           value: 13.032499999999999
                 - task:
                         name: WMT_EN-RO_finetuned
                         type: WMT_EN-RO_finetuned
                   metrics:
+                        - name: Average bleu
                           type: bleu
                           value: 27.8468226696502
                 - task:
                         name: WMT_RO-EN_finetuned
                         type: WMT_RO-EN_finetuned
                   metrics:
+                        - name: Average bleu
                           type: bleu
                           value: 39.300054525566104
                 - task:
                         name: XQuAD
                         type: XQuAD
                   metrics:
+                        - name: Average exact_match
                           type: exact_match
                           value: 30.14705
                 - task:
                         name: XQuAD
                         type: XQuAD
                   metrics:
+                        - name: Average f1
                           type: f1
                           value: 47.0304
                 - task:
                         name: XQuAD_finetuned
                         type: XQuAD_finetuned
                   metrics:
+                        - name: Average exact_match
                           type: exact_match
                           value: 67.0588235294117
                 - task:
                         name: XQuAD
                         type: XQuAD
                   metrics:
+                        - name: Average f1
                           type: f1
                           value: 79.9624140326139
                 - task:
                         name: STS
                         type: STS
                   metrics:
+                        - name: Average spearman
                           type: spearman
                           value: 7.886666666666667
                 - task:
                         name: STS
                         type: STS
                   metrics:
+                        - name: Average pearson
                           type: pearson
                           value: 7.976666666666667
                 - task:
                         name: STS_finetuned
                         type: STS_finetuned
                   metrics:
+                        - name: Average spearman
                           type: spearman
                           value: 71.749068976055
                 - task:
                         name: STS_finetuned
                         type: STS_finetuned
                   metrics:
+                        - name: Average pearson
                           type: pearson
                           value: 71.9866084841066
 ---