iamsubrata
/

finetuned_EleutherAI_pythia_70m_on_lamini_docs

@@ -33,19 +33,23 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 1e-05
-- train_batch_size: 2
-- eval_batch_size: 2
 - seed: 42
 - gradient_accumulation_steps: 4
-- total_train_batch_size: 8
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - lr_scheduler_warmup_steps: 1
 - num_epochs: 10
 ### Framework versions
 - Transformers 4.36.2
-- Pytorch 2.0.0
 - Datasets 2.16.1
 - Tokenizers 0.15.0

 The following hyperparameters were used during training:
 - learning_rate: 1e-05
+- train_batch_size: 1
+- eval_batch_size: 1
 - seed: 42
 - gradient_accumulation_steps: 4
+- total_train_batch_size: 4
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - lr_scheduler_warmup_steps: 1
 - num_epochs: 10
+### Training results
 ### Framework versions
 - Transformers 4.36.2
+- Pytorch 2.1.0+cu121
 - Datasets 2.16.1
 - Tokenizers 0.15.0

final/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:558432d49128b5230a0b8d41be4195d0cf44c9c0a69c65b954fbaebda3cc873e
-size 4283

 version https://git-lfs.github.com/spec/v1
+oid sha256:d4c57111ec2af60e288000900b01ddaeb5601f4a73aa47735dd6cdfb97a70d22
+size 4728

runs/Jan02_11-31-41_b1e9bb81fd8d/events.out.tfevents.1704195101.b1e9bb81fd8d.5031.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:057b1852301f1556635fb6d4ad58ad7f70e9ebad9dafc62ff4569338e370de99
-size 1013746

 version https://git-lfs.github.com/spec/v1
+oid sha256:49961460c6729bbf6779354147a2ac6bd9646abd914f0f02e1a2217bfbac8606
+size 1023543