Spaces:

babylm
/

leaderboard-2024

Running

Aaron Mueller commited on Nov 25, 2024

Commit

8f1a599

1 Parent(s): 5285ff5

fix order of averages

Files changed (2) hide show

src/display/utils.py CHANGED Viewed

@@ -38,7 +38,8 @@ auto_eval_column_dict_multimodal.append(["model", ColumnContent, ColumnContent("
 auto_eval_column_dict_multimodal.append(["track", ColumnContent, ColumnContent("Track", "markdown", False)])
 for task in TasksMultimodal:
     auto_eval_column_dict_multimodal.append([task.name, ColumnContent, ColumnContent(task.value.col_name, "number", True)])
-auto_eval_column_dict_multimodal.append(["text_average", ColumnContent, ColumnContent("Text Average", "number", True)])
 auto_eval_column_dict_multimodal.append(["vision_average", ColumnContent, ColumnContent("Vision Average", "number", True)])
 auto_eval_column_dict_multimodal.append(["still_on_hub", ColumnContent, ColumnContent("Available on the hub", "bool", False)])
 auto_eval_column_dict_multimodal.append(["revision", ColumnContent, ColumnContent("Model sha", "str", False, False)])

 auto_eval_column_dict_multimodal.append(["track", ColumnContent, ColumnContent("Track", "markdown", False)])
 for task in TasksMultimodal:
     auto_eval_column_dict_multimodal.append([task.name, ColumnContent, ColumnContent(task.value.col_name, "number", True)])
+    if task.name in ("ewok", "EWoK"):   # make sure this appears in the right order
+        auto_eval_column_dict_multimodal.append(["text_average", ColumnContent, ColumnContent("Text Average", "number", True)])
 auto_eval_column_dict_multimodal.append(["vision_average", ColumnContent, ColumnContent("Vision Average", "number", True)])
 auto_eval_column_dict_multimodal.append(["still_on_hub", ColumnContent, ColumnContent("Available on the hub", "bool", False)])
 auto_eval_column_dict_multimodal.append(["revision", ColumnContent, ColumnContent("Model sha", "str", False, False)])

src/leaderboard/read_evals.py CHANGED Viewed

@@ -102,7 +102,7 @@ class EvalResult:
     def to_dict(self):
         """Converts the Eval Result to a dict compatible with our dataframe display"""
         eval_column = AutoEvalColumnMultimodal if self.track.lower() == "multimodal" else AutoEvalColumn
-        vision_tasks = ("VQA", "Winoground", "DevBench")
         text_average = sum([v for k, v in self.results.items() if v is not None and k not in vision_tasks]) / len(Tasks)
         data_dict = {
             "eval_name": self.eval_name,  # not a column, just a save name,

     def to_dict(self):
         """Converts the Eval Result to a dict compatible with our dataframe display"""
         eval_column = AutoEvalColumnMultimodal if self.track.lower() == "multimodal" else AutoEvalColumn
+        vision_tasks = ("VQA", "Winoground", "DevBench", "vqa", "winoground", "devbench")
         text_average = sum([v for k, v in self.results.items() if v is not None and k not in vision_tasks]) / len(Tasks)
         data_dict = {
             "eval_name": self.eval_name,  # not a column, just a save name,