End of training

Browse files

Files changed (4) hide show

README.md +34 -34
adapter_model.bin +1 -1
model.safetensors +1 -1
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -15,7 +15,7 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [google/gemma-2b](https://huggingface.co/google/gemma-2b) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.1016
 ## Model description
@@ -50,39 +50,39 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
-| 1.7996        | 0.09  | 10   | 1.4084          |
-| 0.9949        | 0.18  | 20   | 0.5027          |
-| 0.3011        | 0.27  | 30   | 0.1578          |
-| 0.1527        | 0.36  | 40   | 0.1481          |
-| 0.1447        | 0.45  | 50   | 0.1469          |
-| 0.1451        | 0.54  | 60   | 0.1464          |
-| 0.142         | 0.63  | 70   | 0.1422          |
-| 0.1422        | 0.73  | 80   | 0.1372          |
-| 0.1304        | 0.82  | 90   | 0.1289          |
-| 0.1241        | 0.91  | 100  | 0.1269          |
-| 0.1263        | 1.0   | 110  | 0.1302          |
-| 0.1163        | 1.09  | 120  | 0.1185          |
-| 0.1091        | 1.18  | 130  | 0.1211          |
-| 0.1143        | 1.27  | 140  | 0.1143          |
-| 0.1131        | 1.36  | 150  | 0.1113          |
-| 0.1127        | 1.45  | 160  | 0.1115          |
-| 0.1087        | 1.54  | 170  | 0.1073          |
-| 0.1086        | 1.63  | 180  | 0.1064          |
-| 0.1069        | 1.72  | 190  | 0.1053          |
-| 0.1027        | 1.81  | 200  | 0.1047          |
-| 0.1037        | 1.9   | 210  | 0.1022          |
-| 0.1072        | 1.99  | 220  | 0.1029          |
-| 0.0896        | 2.08  | 230  | 0.1056          |
-| 0.0918        | 2.18  | 240  | 0.1024          |
-| 0.0828        | 2.27  | 250  | 0.1026          |
-| 0.0861        | 2.36  | 260  | 0.1022          |
-| 0.0853        | 2.45  | 270  | 0.1049          |
-| 0.0809        | 2.54  | 280  | 0.1028          |
-| 0.0782        | 2.63  | 290  | 0.1021          |
-| 0.0814        | 2.72  | 300  | 0.1021          |
-| 0.0849        | 2.81  | 310  | 0.1019          |
-| 0.0838        | 2.9   | 320  | 0.1016          |
-| 0.0864        | 2.99  | 330  | 0.1016          |
 ### Framework versions

 This model is a fine-tuned version of [google/gemma-2b](https://huggingface.co/google/gemma-2b) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.1033
 ## Model description
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
+| 1.8196        | 0.09  | 10   | 1.4618          |
+| 1.0741        | 0.18  | 20   | 0.5866          |
+| 0.3626        | 0.27  | 30   | 0.1793          |
+| 0.1587        | 0.36  | 40   | 0.1503          |
+| 0.1454        | 0.45  | 50   | 0.1476          |
+| 0.1461        | 0.54  | 60   | 0.1476          |
+| 0.143         | 0.63  | 70   | 0.1443          |
+| 0.1452        | 0.73  | 80   | 0.1424          |
+| 0.1345        | 0.82  | 90   | 0.1372          |
+| 0.1286        | 0.91  | 100  | 0.1308          |
+| 0.131         | 1.0   | 110  | 0.1317          |
+| 0.123         | 1.09  | 120  | 0.1265          |
+| 0.1161        | 1.18  | 130  | 0.1272          |
+| 0.1188        | 1.27  | 140  | 0.1170          |
+| 0.1197        | 1.36  | 150  | 0.1149          |
+| 0.1139        | 1.45  | 160  | 0.1146          |
+| 0.1122        | 1.54  | 170  | 0.1117          |
+| 0.1093        | 1.63  | 180  | 0.1098          |
+| 0.1093        | 1.72  | 190  | 0.1085          |
+| 0.1096        | 1.81  | 200  | 0.1068          |
+| 0.1086        | 1.9   | 210  | 0.1064          |
+| 0.107         | 1.99  | 220  | 0.1065          |
+| 0.0961        | 2.08  | 230  | 0.1069          |
+| 0.0946        | 2.18  | 240  | 0.1061          |
+| 0.0883        | 2.27  | 250  | 0.1048          |
+| 0.0933        | 2.36  | 260  | 0.1039          |
+| 0.0904        | 2.45  | 270  | 0.1058          |
+| 0.0862        | 2.54  | 280  | 0.1057          |
+| 0.0818        | 2.63  | 290  | 0.1047          |
+| 0.0852        | 2.72  | 300  | 0.1046          |
+| 0.0895        | 2.81  | 310  | 0.1048          |
+| 0.0914        | 2.9   | 320  | 0.1044          |
+| 0.0909        | 2.99  | 330  | 0.1033          |
 ### Framework versions

adapter_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4e6dbd6c38366c689cc60bb16d90f9e9991f4f27d968ebb314cc2693c546d554
 size 63405598

 version https://git-lfs.github.com/spec/v1
+oid sha256:687f9ff1b92985a3a84a245096fd7c7c652555e369d6b0997c593c55c1861b6d
 size 63405598

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ba333e762cb476da513a605d37dddce2a875af2d68b389f0eb5da4840d4ced12
 size 10087984512

 version https://git-lfs.github.com/spec/v1
+oid sha256:0c15583beafd12060ea737a3f93d47dca098ae34560f7eb6c1104639d42a806a
 size 10087984512

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:bbbae36a6ec3e9b895651dfef096e7c256087484e7df020722c4c9ca90403218
 size 5112

 version https://git-lfs.github.com/spec/v1
+oid sha256:6bb53fe66eacf5f9b97fdf3207b8d8044395b3d989c3204e5d944903109e59bf
 size 5112