leaderboards - a fpreiss Collection

fpreiss 's Collections

papers-context-length

papers-efficiency

papers-reasoning

leaderboards

updated Jul 1, 2024

Running

185

185

Yet Another LLM Leaderboard

🌖

Run a Streamlit web app
Running on CPU Upgrade

50

50

Open CoT Leaderboard

🥇

Track, rank and evaluate open LLMs' CoT quality
Running on CPU Upgrade

12.4k

12.4k

Open LLM Leaderboard

🏆

Track, rank and evaluate open LLMs and chatbots
Running

3.97k

3.97k

Chatbot Arena Leaderboard

🏆
Runtime error

22

22

Yet Another LLM Leaderboard

🌖
Running

430

430

Can Ai Code Results

🏆

Generate animated avatars from images
Running on CPU Upgrade

4.71k

4.71k

MTEB Leaderboard

🥇

Select and filter benchmarks for text embedding tasks
Running on CPU Upgrade

597

597

Open VLM Leaderboard

🌎

VLMEvalKit Evaluation Results Collection
Running

65

65

Toolbench Leaderboard

⚡

Display ToolBench model performance results
Runtime error

29

29

Open RL Leaderboard

🥇
Configuration error

34

34

Leaderboard

🐠
Running on CPU Upgrade

258

258

GAIA Leaderboard

🦾

Submit and evaluate models on a leaderboard
Running

8

8

Paper-LeaderBoard

📖

Read top papers
Running

276

276

LLM Performance Leaderboard

🐨

View LLM Performance Leaderboard
Runtime error

29

29

Open LLM Leaderboard for domains

📊

Ranking for Open-sourced LLMs in different domains
Running on CPU Upgrade

146

146

Open LLM Progress Tracker

🔬

Visualize LLM progress with interactive filters
Running

84

84

imgsys.org

📊

imgsys.org -- arena for text guided image generation
Running

1.11k

1.11k

Big Code Models Leaderboard

📈

Submit code models for evaluation on benchmarks
Running

417

417

LLM-Perf Leaderboard

🏆

Explore hardware performance for language models
Running

326

326

Reward Bench Leaderboard

📐

Explore and analyze RewardBench leaderboard data
Running on CPU Upgrade

609

609

Open ASR Leaderboard

🏆

Request evaluation results for a speech model
Running

163

163

Low-bit Quantized Open LLM Leaderboard

🏆

Track, rank and evaluate open LLMs and chatbots
Running on CPU Upgrade

78

78

Open LLM Leaderboard

🏆

Track, rank and evaluate open LLMs and chatbots