Liu-Xiang
/

tinyllama_hindi_sentence_retrieval_sft

Generated from Trainer

Model card Files Files and versions Community

Liu-Xiang commited on Jul 24, 2024

Commit

4bb3c30

·

verified ·

1 Parent(s): 8a0eed8

Model save

Files changed (2) hide show

README.md +6 -6
adapter_model.safetensors +1 -1

README.md CHANGED Viewed

@@ -1,13 +1,13 @@
 ---
-license: apache-2.0
 library_name: peft
 tags:
 - trl
 - sft
 - generated_from_trainer
-base_model: TinyLlama/TinyLlama-1.1B-Chat-v1.0
-datasets:
-- generator
 model-index:
 - name: tinyllama_hindi_sentence_retrieval_sft
   results: []
@@ -38,11 +38,11 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 0.0002
-- train_batch_size: 8
 - eval_batch_size: 8
 - seed: 42
 - gradient_accumulation_steps: 2
-- total_train_batch_size: 16
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: constant
 - lr_scheduler_warmup_ratio: 0.03

 ---
+base_model: TinyLlama/TinyLlama-1.1B-Chat-v1.0
+datasets:
+- generator
 library_name: peft
+license: apache-2.0
 tags:
 - trl
 - sft
 - generated_from_trainer
 model-index:
 - name: tinyllama_hindi_sentence_retrieval_sft
   results: []
 The following hyperparameters were used during training:
 - learning_rate: 0.0002
+- train_batch_size: 4
 - eval_batch_size: 8
 - seed: 42
 - gradient_accumulation_steps: 2
+- total_train_batch_size: 8
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: constant
 - lr_scheduler_warmup_ratio: 0.03

adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:cde20a815dcaeb769af1ca00a24a98df8ba8dd4d6f85a90c1f8f789aa9166a31
 size 50503848

 version https://git-lfs.github.com/spec/v1
+oid sha256:aa2bdd707899c10af69dd3fceb7f1c2b941ec5bb786dfe6fe92436c5ee30fcc4
 size 50503848