SylvanL
/

ChatTCM-7B-Pretrain

Text Generation

Model card Files Files and versions Community

SylvanL commited on Oct 23, 2024

Commit

0ddb88d

·

verified ·

1 Parent(s): 20d8d15

Update README.md

Files changed (1) hide show

README.md +6 -3

README.md CHANGED Viewed

@@ -8,8 +8,11 @@ base_model:
 - Qwen/Qwen2-7B-Instruct
 ---
-在2张V800-80G上, 基于Qwen/Qwen2-7B-Instruct上, 使用SylvanL/Traditional-Chinese-Medicine-Dataset-Pretrain进行了2个epoch的继续预训练.
 epoch 1:
 total FLOS 824852GF
@@ -17,14 +20,14 @@ train loss: 1.6586
 train_samples_per_second: 3.246
 train_steps_per_second: 0.014
 train_runtime: 37:01:33.17
-perplexity: 7.2646328377141005
 epoch 2:
 train loss: 1.3895
 train_samples_per_second: 3.11
 train_steps_per_second: 0.014
 train_runtime: 38:38:44.20
-perplexity:
 ```
 llamafactory-cli train \

 - Qwen/Qwen2-7B-Instruct
 ---
+在2张V800-80G上,
+基于Qwen/Qwen2-7B-Instruct,
+使用SylvanL/Traditional-Chinese-Medicine-Dataset-Pretrain进行了2个epoch的继续预训练(Continue Pre-train).
 epoch 1:
 total FLOS 824852GF
 train_samples_per_second: 3.246
 train_steps_per_second: 0.014
 train_runtime: 37:01:33.17
+average perplexity: 7.2646328377141005
 epoch 2:
 train loss: 1.3895
 train_samples_per_second: 3.11
 train_steps_per_second: 0.014
 train_runtime: 38:38:44.20
+average perplexity: 5.800355962033688
 ```
 llamafactory-cli train \