Spaces:

LLM360
/

de-arena

Running

App Files Files Community

yzabc007 commited on Oct 21

Commit

6c01f70

•

1 Parent(s): e91235d

Update space

Browse files

Files changed (1) hide show

app.py +50 -17

app.py CHANGED Viewed

@@ -164,25 +164,58 @@ with demo:
             """
             gr.Markdown(DESCRIPTION_TEXT, elem_classes="markdown-text")
-            leaderboard = overall_leaderboard(
-                get_model_leaderboard_df(
-                    model_result_path,
-                    benchmark_cols=[
-                        # AutoEvalColumn.rank_overall.name,
-                        AutoEvalColumn.model.name,
-                        AutoEvalColumn.rank_overall.name,
-                        AutoEvalColumn.rank_math_algebra.name,
-                        AutoEvalColumn.rank_math_geometry.name,
-                        AutoEvalColumn.rank_math_probability.name,
-                        AutoEvalColumn.rank_reason_logical.name,
-                        AutoEvalColumn.rank_reason_social.name,
-                        AutoEvalColumn.rank_chemistry.name,
-                        # AutoEvalColumn.rank_cpp.name,
-                        ],
-                    rank_col=[],
                 )
-            )
         with gr.TabItem("🔢 Math", elem_id="math-tab-table", id=2):

             """
             gr.Markdown(DESCRIPTION_TEXT, elem_classes="markdown-text")
+            with gr.TabItem("Sort by Rank", elem_id="overall_sort_by_rank_subtab", id=0, elem_classes="subtab"):
+                leaderboard = overall_leaderboard(
+                    get_model_leaderboard_df(
+                        model_result_path,
+                        benchmark_cols=[
+                            # AutoEvalColumn.rank_overall.name,
+                            AutoEvalColumn.model.name,
+                            AutoEvalColumn.rank_overall.name,
+                            AutoEvalColumn.rank_math_algebra.name,
+                            AutoEvalColumn.rank_math_geometry.name,
+                            AutoEvalColumn.rank_math_probability.name,
+                            AutoEvalColumn.rank_reason_logical.name,
+                            AutoEvalColumn.rank_reason_social.name,
+                            AutoEvalColumn.rank_chemistry.name,
+                            # AutoEvalColumn.rank_cpp.name,
+                            ],
+                        rank_col=[],
+                    )
                 )
+            with gr.TabItem("Sort by Score", elem_id="overall_sort_by_score_subtab", id=1, elem_classes="subtab"):
+                leaderboard = overall_leaderboard(
+                    get_model_leaderboard_df(
+                        model_result_path,
+                        benchmark_cols=[
+                            # AutoEvalColumn.rank_overall.name,
+                            AutoEvalColumn.model.name,
+                            AutoEvalColumn.license.name,
+                            AutoEvalColumn.organization.name,
+                            AutoEvalColumn.knowledge_cutoff.name,
+                            AutoEvalColumn.score_overall.name,
+                            AutoEvalColumn.score_math_algebra.name,
+                            AutoEvalColumn.score_math_geometry.name,
+                            AutoEvalColumn.score_math_probability.name,
+                            AutoEvalColumn.score_reason_logical.name,
+                            AutoEvalColumn.score_reason_social.name,
+                            AutoEvalColumn.score_chemistry.name,
+                            # AutoEvalColumn.score_cpp.name,
+                            # AutoEvalColumn.rank_overall.name,
+                            # AutoEvalColumn.rank_math_algebra.name,
+                            # AutoEvalColumn.rank_math_geometry.name,
+                            # AutoEvalColumn.rank_math_probability.name,
+                            # AutoEvalColumn.rank_reason_logical.name,
+                            # AutoEvalColumn.rank_reason_social.name,
+                            # AutoEvalColumn.rank_chemistry.name,
+                            # AutoEvalColumn.rank_cpp.name,
+                            ],
+                        rank_col=['sort_by_score'],
+                    )
+                )
         with gr.TabItem("🔢 Math", elem_id="math-tab-table", id=2):