Update README.md
Browse files
README.md
CHANGED
@@ -9,6 +9,10 @@
|
|
9 |
<!-- Provide a quick summary of what the model is/does. -->
|
10 |
chuxin-embedding 是专为增强中文文本检索能力而设计的嵌入模型。它基于bge-m3-retromae[1],实现了预训练、微调、精调全流程。该模型在来自各个领域的大量语料库上进行训练,语料库的批量非常大。截至 2024 年 8 月 27 日,chuxin-embedding 在检索任务中表现出色,在 C-MTEB 排行榜上排名第一,领先的性能得分为 78.23。
|
11 |
|
|
|
|
|
|
|
|
|
12 |
## Training Details
|
13 |
基于bge-m3-retromae[1],主要改动如下:
|
14 |
<!-- Provide a longer summary of what this model is. -->
|
@@ -29,6 +33,22 @@ chuxin-embedding 是专为增强中文文本检索能力而设计的嵌入模型
|
|
29 |
5. miracl/miracl
|
30 |
6. FreedomIntelligence/Huatuo26M-Lite
|
31 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
32 |
## Generate Embedding for text
|
33 |
```python
|
34 |
from FlagEmbedding import BGEM3FlagModel
|
|
|
9 |
<!-- Provide a quick summary of what the model is/does. -->
|
10 |
chuxin-embedding 是专为增强中文文本检索能力而设计的嵌入模型。它基于bge-m3-retromae[1],实现了预训练、微调、精调全流程。该模型在来自各个领域的大量语料库上进行训练,语料库的批量非常大。截至 2024 年 8 月 27 日,chuxin-embedding 在检索任务中表现出色,在 C-MTEB 排行榜上排名第一,领先的性能得分为 78.23。
|
11 |
|
12 |
+
## News
|
13 |
+
- 2024/9/4:xxx
|
14 |
+
- 2024/9/4:xxx
|
15 |
+
|
16 |
## Training Details
|
17 |
基于bge-m3-retromae[1],主要改动如下:
|
18 |
<!-- Provide a longer summary of what this model is. -->
|
|
|
33 |
5. miracl/miracl
|
34 |
6. FreedomIntelligence/Huatuo26M-Lite
|
35 |
|
36 |
+
## Performance
|
37 |
+
**C_MTEB RETRIEVAL**
|
38 |
+
| Model | **Average** | **CmedqaRetrieval** | **CovidRetrieval** | **DuRetrieval** | **EcomRetrieval** | **MedicalRetrieval** | **MMarcoRetrieval** | **T2Retrieval** | **VideoRetrieval** |
|
39 |
+
| :-------------------: | :---------: | :-------: | :------------: | :-----------: | :-----------: | :-------: | :----------: | :-------: | :----------: |
|
40 |
+
| Zhihui_LLM_Embedding | 76.74 | 48.69 | 84.39 | 91.34 | 71.96 | 65.19 | 84.77 |88.3 | 79.31 |
|
41 |
+
| zpoint_large_embedding_zh | 76.36 | 47.16 | 89.14 | 89.23 | 70.74 | 68.14 | 82.38 | 83.81 | 80.26 |
|
42 |
+
| **chuxin-embedding** | **78.23** | 55.84 | 84.28 | 85.98 | 74.85 | 77.23 | 79.17 | 84.42 | 84.12 |
|
43 |
+
|
44 |
+
**AIR-Bench**
|
45 |
+
| Model | **Average** | **wiki_zh** | **web_zh** | **news_zh** | **healthcare_zh** | **finance_zh** |
|
46 |
+
| :-------------------: | :---------: | :-------: | :------------: | :-----------: | :-----------: | :----------: |
|
47 |
+
| Zhihui_LLM_Embedding | 76.74 | 48.69 | 84.39 | 91.34 | 71.96 | 65.19 |
|
48 |
+
| zpoint_large_embedding_zh | 76.36 | 47.16 | 89.14 | 89.23 | 70.74 | 68.14 |
|
49 |
+
| **chuxin-embedding** | **78.23** | 55.84 | 84.28 | 85.98 | 74.85 | 77.23 |
|
50 |
+
|
51 |
+
|
52 |
## Generate Embedding for text
|
53 |
```python
|
54 |
from FlagEmbedding import BGEM3FlagModel
|