Spaces:

mideind
/

icelandic-llm-leaderboard

Running

App Files Files Community

icelandic-llm-leaderboard

Commit History

remove unneeded deps from requirements.txt

0e715de

Running

gardarjuto commited on Jan 13

fix: description text

b9777d9

gardarjuto commited on Jul 15, 2024

Add WikiQA

fa8bb65

gardarjuto commited on Jul 15, 2024

fix: show partial results even if some evaluations haven't finished

7fdb5f5

gardarjuto commited on Jul 15, 2024

fix: read request information even if eval is running

b61f534

gardarjuto commited on Jul 15, 2024

Update app.py

9a10727
verified

gardari commited on Jul 6, 2024

switch to flat inflection benchmark

8874217

gardarjuto commited on Jul 4, 2024

add wrapping to leaderboard

a5bd804

gardarjuto commited on Jul 3, 2024

add submission instructions to about page

80793c6

gardarjuto commited on Jul 3, 2024

remove submit tab

117d89c

gardarjuto commited on Jul 3, 2024

Update app.py

9b8b426
verified

gardari commited on Jul 3, 2024

debug restart interval

fdb1fcf
verified

gardari commited on Jul 3, 2024

fix: type hints for styling function

0be9d2f

gardarjuto commited on Jul 1, 2024

Factor out floating point styling to a function

90021e9

gardarjuto commited on Jul 1, 2024

fix: filtering support for models missing details

5e8e87c

gardarjuto commited on Jul 1, 2024

remove intro text and citation block

dcb54b6

gardarjuto commited on Jul 1, 2024

add benchmark descriptions and links to About page

67a665c

gardarjuto commited on Jul 1, 2024

Increase floating point number in benchmark metrics

7fcf611

gardarjuto commited on Jun 28, 2024

add winogrande and arc-challenge

56926f2

gardarjuto commited on Jun 28, 2024

show private models by default

2bd1158

gardarjuto commited on Jun 28, 2024

skip model detail validation for OAI/Anthropic models

4ec9008

gardarjuto commited on Jun 27, 2024

fix typo in metric name

b1416b0

gardarjuto commited on Jun 26, 2024

remove debug prints

9e6a3bf

gardarjuto commited on Jun 26, 2024

fix metric name

a0ee03a

gardarjuto commited on Jun 26, 2024

add debug prints

105e1f2

gardarjuto commited on Jun 26, 2024

revert to correct usage of ModelDetails (without api)

24c8d00

gardarjuto commited on Jun 26, 2024

remove swp

1e9c5dd

gardarjuto commited on Jun 26, 2024

debug print

ee4b341

gardarjuto commited on Jun 26, 2024

debug print

a5c094b
verified

gardari commited on Jun 26, 2024

debug print

decb818
verified

gardari commited on Jun 26, 2024

debug print

6a989eb
verified

gardari commited on Jun 26, 2024

debug print

427f12d
verified

gardari commited on Jun 26, 2024

debug print

ea10299
verified

gardari commited on Jun 26, 2024

Added empty default for api in ModelDetails

e8f05cc
verified

gardari commited on Jun 26, 2024

Added model API to submission screen

20fd601
verified

gardari commited on Jun 26, 2024

add Icelandic evals

9ef7f1a
verified

gardari commited on Jun 25, 2024

switch to mideind's fork of Eval Harness

da87917
verified

gardari commited on Jun 25, 2024

Change metric string

96f9cbe
verified

gardari commited on Jun 24, 2024

Comment out winogrande for debugging

ab6318a
verified

gardari commited on Jun 24, 2024

Add task

839d7dc
verified

gardari commited on Jun 24, 2024

Change title

4d276e3
verified

gardari commited on Jun 24, 2024

Change title

2a3757e
verified

gardari commited on Jun 24, 2024

Change title

72a1baf
verified

gardari commited on Jun 24, 2024

Make name for HF token explicit

bd503b0
verified

gardari commited on Jun 21, 2024

Fix repo names

c9a0e12
verified

gardari commited on Jun 21, 2024

Update src/envs.py

d7e7ffd
verified

gardari commited on Jun 21, 2024

Update requirements.txt

bcc83eb
verified

clefourrier HF staff commited on Jun 6, 2024

Update README.md

d0f181a
verified

clefourrier HF staff commited on Jun 6, 2024

Update app.py

84582a1
verified

clefourrier HF staff commited on Apr 23, 2024

doc

c1b8a96

Clémentine commited on Apr 11, 2024