Commit
·
2739291
1
Parent(s):
fd69df7
Update README.md
Browse files
README.md
CHANGED
@@ -44,17 +44,18 @@ tags:
|
|
44 |
由于模型参数量较小和自回归生成范式,尽管模型提供了有关疾病诊断和治疗的推理结果,但这些结果不能代替线下职业医生的建议和治疗方案。所有回答仅供参考,不应作为诊断或治疗的依据。我们强烈建议用户在需要诊断或治疗疾病时,寻求专业医生的帮助和建议。
|
45 |
|
46 |
### Elo评测
|
47 |
-
| model_name
|
48 |
-
|
49 |
-
| GPT4
|
50 |
-
| ChatGPT
|
51 |
-
|
|
52 |
-
|
|
53 |
-
|
|
54 |
-
| BianQue
|
55 |
-
|
|
56 |
-
|
|
57 |
-
|
|
|
|
58 |
|
59 |
|
60 |
## 推理
|
|
|
44 |
由于模型参数量较小和自回归生成范式,尽管模型提供了有关疾病诊断和治疗的推理结果,但这些结果不能代替线下职业医生的建议和治疗方案。所有回答仅供参考,不应作为诊断或治疗的依据。我们强烈建议用户在需要诊断或治疗疾病时,寻求专业医生的帮助和建议。
|
45 |
|
46 |
### Elo评测
|
47 |
+
| model_name | model_size | ALL | MedQA_Mainland | PromptCBLUE | webMedQA |
|
48 |
+
|:------------------------------|:-------------|------:|-----------------:|--------------:|-----------:|
|
49 |
+
| GPT4 | 220B*8(?) | 1195 | 1087 | 1134 | 1107 |
|
50 |
+
| ChatGPT | 175B(?) | 1123 | 1053 | 1089 | 1067 |
|
51 |
+
| PULSE_7b with prompt | 7B | 1074 | 1019 | 1047 | 1060 |
|
52 |
+
| PULSE_14b | 14B | 1055 | 1001 | 1037 | 1056 |
|
53 |
+
| PULSE_7b | 7B | 1054 | 1028 | 1037 | 1030 |
|
54 |
+
| BianQue | 6B | 926 | 939 | 920 | 1011 |
|
55 |
+
| QiZhenGPT | 13B | 918 | 949 | 935 | 974 |
|
56 |
+
| Med-ChatGLM | 6B | 864 | 988 | 921 | 859 |
|
57 |
+
| BenTsao | 7B | 846 | 966 | 913 | 859 |
|
58 |
+
| DoctorGLM | 6B | 812 | 935 | 891 | 856 |
|
59 |
|
60 |
|
61 |
## 推理
|