sigridjineth
/

ko-reranker-v1.1

Model card Files Files and versions Community

sigridjineth commited on Dec 14, 2024

Commit

d25c6cf

·

verified ·

1 Parent(s): 1539793

Update README.md

Files changed (1) hide show

README.md +31 -0

README.md CHANGED Viewed

@@ -36,6 +36,37 @@ These combined resources ensure coverage across a wide range of topics, styles,
 - **Need for Evaluation**:
   Developing and standardizing benchmarks for generalized Korean retrieval tasks (especially for rerankers) will be an ongoing effort.
 ## Usage (transformers>=4.36.0)
 ```python

 - **Need for Evaluation**:
   Developing and standardizing benchmarks for generalized Korean retrieval tasks (especially for rerankers) will be an ongoing effort.
+## Evaluation
+The [AutoRAG Benchmark](https://github.com/Marker-Inc-Korea/AutoRAG-example-korean-embedding-benchmark) serves as both the evaluation dataset and the toolkit for reporting these metrics.
+### Model: `sigridjineth/ko-reranker-v1.1-preview`
+| top_k | Execution Time | F1     | Recall | Precision | MAP    | MRR    | NDCG   | Is Best |
+|-------|----------------|--------|--------|-----------|--------|--------|--------|---------|
+| 1     | 0.0438         | 0.6754 | 0.6754 | 0.6754    | 0.6754 | 0.6754 | 0.6754 | True    |
+| 3     | 0.0486         | 0.3684 | 0.7368 | 0.2456    | 0.7032 | 0.7032 | 0.7119 | False   |
+| 5     | 0.0446         | 0.3684 | 0.7368 | 0.2456    | 0.7032 | 0.7032 | 0.7119 | False   |
+---
+### Model: `Alibaba-NLP/gte-multilingual-reranker-base`
+| top_k | Execution Time | F1     | Recall | Precision | MAP    | MRR    | NDCG   | Is Best |
+|-------|----------------|--------|--------|-----------|--------|--------|--------|---------|
+| 1     | 0.0481         | 0.6316 | 0.6316 | 0.6316    | 0.6316 | 0.6316 | 0.6316 | True    |
+| 3     | 0.0427         | 0.3596 | 0.7193 | 0.2398    | 0.6725 | 0.6725 | 0.6846 | False   |
+| 5     | 0.0442         | 0.3596 | 0.7193 | 0.2398    | 0.6725 | 0.6725 | 0.6846 | False   |
+---
+### Model: `dragonkue/bge-reranker-v2-m3-ko`
+| top_k | Execution Time | F1     | Recall | Precision | MAP    | MRR    | NDCG   | Is Best |
+|-------|----------------|--------|--------|-----------|--------|--------|--------|---------|
+| 1     | 0.0814         | 0.6930 | 0.6930 | 0.6930    | 0.6930 | 0.6930 | 0.6930 | True    |
+| 3     | 0.0813         | 0.3596 | 0.7193 | 0.2398    | 0.7061 | 0.7061 | 0.7096 | False   |
+| 5     | 0.0824         | 0.3596 | 0.7193 | 0.2398    | 0.7061 | 0.7061 | 0.7096 | False   |
 ## Usage (transformers>=4.36.0)
 ```python