Chrislu commited on
Commit
331cb20
·
verified ·
1 Parent(s): 3498c5b

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +20 -0
README.md CHANGED
@@ -9,6 +9,10 @@
9
  <!-- Provide a quick summary of what the model is/does. -->
10
  chuxin-embedding 是专为增强中文文本检索能力而设计的嵌入模型。它基于bge-m3-retromae[1],实现了预训练、微调、精调全流程。该模型在来自各个领域的大量语料库上进行训练,语料库的批量非常大。截至 2024 年 8 月 27 日,chuxin-embedding 在检索任务中表现出色,在 C-MTEB 排行榜上排名第一,领先的性能得分为 78.23。
11
 
 
 
 
 
12
  ## Training Details
13
  基于bge-m3-retromae[1],主要改动如下:
14
  <!-- Provide a longer summary of what this model is. -->
@@ -29,6 +33,22 @@ chuxin-embedding 是专为增强中文文本检索能力而设计的嵌入模型
29
  5. miracl/miracl
30
  6. FreedomIntelligence/Huatuo26M-Lite
31
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
32
  ## Generate Embedding for text
33
  ```python
34
  from FlagEmbedding import BGEM3FlagModel
 
9
  <!-- Provide a quick summary of what the model is/does. -->
10
  chuxin-embedding 是专为增强中文文本检索能力而设计的嵌入模型。它基于bge-m3-retromae[1],实现了预训练、微调、精调全流程。该模型在来自各个领域的大量语料库上进行训练,语料库的批量非常大。截至 2024 年 8 月 27 日,chuxin-embedding 在检索任务中表现出色,在 C-MTEB 排行榜上排名第一,领先的性能得分为 78.23。
11
 
12
+ ## News
13
+ - 2024/9/4:xxx
14
+ - 2024/9/4:xxx
15
+
16
  ## Training Details
17
  基于bge-m3-retromae[1],主要改动如下:
18
  <!-- Provide a longer summary of what this model is. -->
 
33
  5. miracl/miracl
34
  6. FreedomIntelligence/Huatuo26M-Lite
35
 
36
+ ## Performance
37
+ **C_MTEB RETRIEVAL**
38
+ | Model | **Average** | **CmedqaRetrieval** | **CovidRetrieval** | **DuRetrieval** | **EcomRetrieval** | **MedicalRetrieval** | **MMarcoRetrieval** | **T2Retrieval** | **VideoRetrieval** |
39
+ | :-------------------: | :---------: | :-------: | :------------: | :-----------: | :-----------: | :-------: | :----------: | :-------: | :----------: |
40
+ | Zhihui_LLM_Embedding | 76.74 | 48.69 | 84.39 | 91.34 | 71.96 | 65.19 | 84.77 |88.3 | 79.31 |
41
+ | zpoint_large_embedding_zh | 76.36 | 47.16 | 89.14 | 89.23 | 70.74 | 68.14 | 82.38 | 83.81 | 80.26 |
42
+ | **chuxin-embedding** | **78.23** | 55.84 | 84.28 | 85.98 | 74.85 | 77.23 | 79.17 | 84.42 | 84.12 |
43
+
44
+ **AIR-Bench**
45
+ | Model | **Average** | **wiki_zh** | **web_zh** | **news_zh** | **healthcare_zh** | **finance_zh** |
46
+ | :-------------------: | :---------: | :-------: | :------------: | :-----------: | :-----------: | :----------: |
47
+ | Zhihui_LLM_Embedding | 76.74 | 48.69 | 84.39 | 91.34 | 71.96 | 65.19 |
48
+ | zpoint_large_embedding_zh | 76.36 | 47.16 | 89.14 | 89.23 | 70.74 | 68.14 |
49
+ | **chuxin-embedding** | **78.23** | 55.84 | 84.28 | 85.98 | 74.85 | 77.23 |
50
+
51
+
52
  ## Generate Embedding for text
53
  ```python
54
  from FlagEmbedding import BGEM3FlagModel