Update README.md
Browse files
README.md
CHANGED
|
@@ -10,13 +10,16 @@ tags:
|
|
| 10 |
- medical
|
| 11 |
---
|
| 12 |
|
| 13 |
-
|
| 14 |
在2张V800-80G上,
|
| 15 |
|
| 16 |
基于Qwen/Qwen2-7B-Instruct, 在llamafactory框架上,
|
| 17 |
|
| 18 |
使用SylvanL/Traditional-Chinese-Medicine-Dataset-Pretrain进行了2个epoch的继续预训练(Continue Pre-train).
|
| 19 |
|
|
|
|
|
|
|
|
|
|
|
|
|
| 20 |
|
| 21 |
```
|
| 22 |
epoch 1:
|
|
@@ -52,7 +55,7 @@ llamafactory-cli train \
|
|
| 52 |
--template default \
|
| 53 |
--flash_attn auto \
|
| 54 |
--dataset_dir {dataset_dir} \
|
| 55 |
-
--dataset CPT_generalMedical_362420,
|
| 56 |
--cutoff_len 1024 \
|
| 57 |
--learning_rate 6e-06 \
|
| 58 |
--num_train_epochs 2.0 \
|
|
|
|
| 10 |
- medical
|
| 11 |
---
|
| 12 |
|
|
|
|
| 13 |
在2张V800-80G上,
|
| 14 |
|
| 15 |
基于Qwen/Qwen2-7B-Instruct, 在llamafactory框架上,
|
| 16 |
|
| 17 |
使用SylvanL/Traditional-Chinese-Medicine-Dataset-Pretrain进行了2个epoch的继续预训练(Continue Pre-train).
|
| 18 |
|
| 19 |
+
在保留模型原有通用能力的前提下,使模型熟悉、记住,并更倾向于输出以下内容:
|
| 20 |
+
1. 中医问诊单、处方笺、医生诊断及多种格式的病案、医案内容
|
| 21 |
+
2. 中医领域教材与典籍
|
| 22 |
+
3. 中成药、中药材、中医方剂、中医术语、中医疾病、中医症状、药膳食疗相关的知识点
|
| 23 |
|
| 24 |
```
|
| 25 |
epoch 1:
|
|
|
|
| 55 |
--template default \
|
| 56 |
--flash_attn auto \
|
| 57 |
--dataset_dir {dataset_dir} \
|
| 58 |
+
--dataset CPT_generalMedical_362420,{shibing624/huatuo_medical_qa_sharegpt},CPT_medicalRecord_source1_61486,CPT_medicalRecord_source2_15307,CPT_medicalRecord_source3_230000,CPT_tcmKnowledge_source1_17921,CPT_tcmKnowledge_source2_12889,CPT_tcmBooks_source1_146244 \
|
| 59 |
--cutoff_len 1024 \
|
| 60 |
--learning_rate 6e-06 \
|
| 61 |
--num_train_epochs 2.0 \
|