Spaces:
Running
Running
Commit
·
8800bfc
1
Parent(s):
1d7eeb1
add newest chatgpt
Browse files- leaderboard_data.csv +1 -0
leaderboard_data.csv
CHANGED
@@ -42,6 +42,7 @@ gpt-4-turbo-2024-04-09,2024-12-05,,False,,65.19999999999999,76.66666666666667,90
|
|
42 |
Llama-3.2-11B-Vision-Instruct,2024-12-05,10670220835.0,True,meta-llama/Llama-3.2-11B-Vision-Instruct,50.36363636363636,55.5,80.0,25.0,62.0,62.5,58.66666666666666,36.0,24.666666666666668,46.66666666666667,50.0
|
43 |
claude-3-haiku-20240307,2024-12-05,,False,,50.47272727272727,59.833333333333336,70.0,0.0,57.333333333333336,50.0,73.55555555555556,26.666666666666664,25.33333333333333,46.66666666666667,60.0
|
44 |
Llama-3.2-90B-Vision-Instruct,2024-12-09,88593355323.0,True,meta-llama/Llama-3.2-90B-Vision-Instruct,67.92727272727274,75.0,75.0,40.0,62.66666666666666,80.0,76.0,56.0,55.0,68.0,76.0
|
|
|
45 |
InternVL2-Llama3-76B,2024-12-09,76262358400.0,True,OpenGVLab/InternVL2-Llama3-76B,51.89090909090909,72.66666666666667,90.0,15.0,60.0,5.0,77.11111111111111,20.33333333333333,14.0,56.66666666666667,76.0
|
46 |
InternVL2-8B,2024-12-05,8075365376.0,True,OpenGVLab/InternVL2-8B,32.03636363636364,49.66666666666667,20.0,0.0,36.0,5.0,36.22222222222222,24.666666666666668,16.333333333333332,31.0,66.0
|
47 |
Qwen2-VL-72B-Instruct,2024-12-05,73405560320.0,True,Qwen/Qwen2-VL-72B-Instruct,74.76363636363637,86.66666666666666,80.0,45.0,62.66666666666666,75.0,83.11111111111111,64.0,84.33333333333334,61.333333333333336,70.0
|
|
|
42 |
Llama-3.2-11B-Vision-Instruct,2024-12-05,10670220835.0,True,meta-llama/Llama-3.2-11B-Vision-Instruct,50.36363636363636,55.5,80.0,25.0,62.0,62.5,58.66666666666666,36.0,24.666666666666668,46.66666666666667,50.0
|
43 |
claude-3-haiku-20240307,2024-12-05,,False,,50.47272727272727,59.833333333333336,70.0,0.0,57.333333333333336,50.0,73.55555555555556,26.666666666666664,25.33333333333333,46.66666666666667,60.0
|
44 |
Llama-3.2-90B-Vision-Instruct,2024-12-09,88593355323.0,True,meta-llama/Llama-3.2-90B-Vision-Instruct,67.92727272727274,75.0,75.0,40.0,62.66666666666666,80.0,76.0,56.0,55.0,68.0,76.0
|
45 |
+
chatgpt-4o-latest (2025-01-29),2025-02-14,,False,,85.34545454545454,80.66666666666666,90.0,80.0,80.0,95.0,90.44444444444444,86.66666666666666,88.66666666666667,83.33333333333334,80.0
|
46 |
InternVL2-Llama3-76B,2024-12-09,76262358400.0,True,OpenGVLab/InternVL2-Llama3-76B,51.89090909090909,72.66666666666667,90.0,15.0,60.0,5.0,77.11111111111111,20.33333333333333,14.0,56.66666666666667,76.0
|
47 |
InternVL2-8B,2024-12-05,8075365376.0,True,OpenGVLab/InternVL2-8B,32.03636363636364,49.66666666666667,20.0,0.0,36.0,5.0,36.22222222222222,24.666666666666668,16.333333333333332,31.0,66.0
|
48 |
Qwen2-VL-72B-Instruct,2024-12-05,73405560320.0,True,Qwen/Qwen2-VL-72B-Instruct,74.76363636363637,86.66666666666666,80.0,45.0,62.66666666666666,75.0,83.11111111111111,64.0,84.33333333333334,61.333333333333336,70.0
|