End of training

Browse files

Files changed (5) hide show

README.md +27 -15
config.json +64 -66
model.safetensors +2 -2
runs/Dec12_22-43-39_a365e7b9463b/events.out.tfevents.1734043420.a365e7b9463b.6288.9 +3 -0
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -18,14 +18,14 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [bert-base-uncased](https://huggingface.co/bert-base-uncased) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.1112
-- Accuracy: 0.9887
-- F1 Macro: 0.7886
-- F1 Micro: 0.9888
-- Precision Macro: 0.8418
-- Precision Micro: 0.9887
-- Recall Macro: 0.7568
-- Recall Micro: 0.9889
 ## Model description
@@ -50,18 +50,30 @@ The following hyperparameters were used during training:
 - seed: 42
 - optimizer: Use adamw_torch with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
-- num_epochs: 6
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss | Accuracy | F1 Macro | F1 Micro | Precision Macro | Precision Micro | Recall Macro | Recall Micro |
 |:-------------:|:-----:|:----:|:---------------:|:--------:|:--------:|:--------:|:---------------:|:---------------:|:------------:|:------------:|
-| 0.0388        | 1.0   | 93   | 0.1275          | 0.9813   | 0.6122   | 0.9816   | 0.7265          | 0.9816          | 0.5596       | 0.9816       |
-| 0.0227        | 2.0   | 186  | 0.1113          | 0.9853   | 0.6907   | 0.9854   | 0.7169          | 0.9853          | 0.6795       | 0.9855       |
-| 0.0085        | 3.0   | 279  | 0.1155          | 0.9868   | 0.7550   | 0.9868   | 0.8260          | 0.9868          | 0.7155       | 0.9869       |
-| 0.0045        | 4.0   | 372  | 0.1146          | 0.9866   | 0.7407   | 0.9867   | 0.7604          | 0.9866          | 0.7299       | 0.9868       |
-| 0.0027        | 5.0   | 465  | 0.1084          | 0.9890   | 0.7935   | 0.9891   | 0.8525          | 0.9890          | 0.7570       | 0.9892       |
-| 0.0008        | 6.0   | 558  | 0.1112          | 0.9887   | 0.7886   | 0.9888   | 0.8418          | 0.9887          | 0.7568       | 0.9889       |
 ### Framework versions

 This model is a fine-tuned version of [bert-base-uncased](https://huggingface.co/bert-base-uncased) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.1052
+- Accuracy: 0.9895
+- F1 Macro: 0.7899
+- F1 Micro: 0.9212
+- Precision Macro: 0.8429
+- Precision Micro: 0.9694
+- Recall Macro: 0.7572
+- Recall Micro: 0.8776
 ## Model description
 - seed: 42
 - optimizer: Use adamw_torch with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
+- num_epochs: 18
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss | Accuracy | F1 Macro | F1 Micro | Precision Macro | Precision Micro | Recall Macro | Recall Micro |
 |:-------------:|:-----:|:----:|:---------------:|:--------:|:--------:|:--------:|:---------------:|:---------------:|:------------:|:------------:|
+| 0.3673        | 1.0   | 93   | 0.2453          | 0.9284   | 0.1919   | 0.4850   | 0.2701          | 0.4678          | 0.1872       | 0.5035       |
+| 0.2176        | 2.0   | 186  | 0.1888          | 0.9439   | 0.2591   | 0.5149   | 0.3936          | 0.6230          | 0.2298       | 0.4388       |
+| 0.1418        | 3.0   | 279  | 0.1454          | 0.9666   | 0.3554   | 0.725    | 0.4120          | 0.7902          | 0.3577       | 0.6697       |
+| 0.0859        | 4.0   | 372  | 0.1238          | 0.9750   | 0.4365   | 0.7789   | 0.6084          | 0.8540          | 0.3946       | 0.7159       |
+| 0.0607        | 5.0   | 465  | 0.1136          | 0.9766   | 0.4979   | 0.7965   | 0.5945          | 0.8606          | 0.4781       | 0.7413       |
+| 0.0413        | 6.0   | 558  | 0.1103          | 0.9827   | 0.4995   | 0.8608   | 0.6097          | 0.9629          | 0.4415       | 0.7783       |
+| 0.0309        | 7.0   | 651  | 0.1109          | 0.9821   | 0.5654   | 0.8558   | 0.6379          | 0.8842          | 0.5439       | 0.8291       |
+| 0.0237        | 8.0   | 744  | 0.1056          | 0.9847   | 0.6330   | 0.8721   | 0.7169          | 0.9227          | 0.5923       | 0.8268       |
+| 0.0154        | 9.0   | 837  | 0.1009          | 0.9858   | 0.6639   | 0.8816   | 0.7079          | 0.9352          | 0.6422       | 0.8337       |
+| 0.0096        | 10.0  | 930  | 0.1003          | 0.9881   | 0.6783   | 0.9047   | 0.7250          | 0.9470          | 0.6494       | 0.8661       |
+| 0.0078        | 11.0  | 1023 | 0.1000          | 0.9889   | 0.7661   | 0.9144   | 0.8075          | 0.9571          | 0.7524       | 0.8753       |
+| 0.0052        | 12.0  | 1116 | 0.1046          | 0.9890   | 0.7563   | 0.9166   | 0.7940          | 0.9619          | 0.7561       | 0.8753       |
+| 0.0041        | 13.0  | 1209 | 0.1022          | 0.9892   | 0.7804   | 0.9177   | 0.8255          | 0.9644          | 0.7570       | 0.8753       |
+| 0.0021        | 14.0  | 1302 | 0.0994          | 0.9887   | 0.7602   | 0.9133   | 0.7959          | 0.9547          | 0.7534       | 0.8753       |
+| 0.0018        | 15.0  | 1395 | 0.1043          | 0.9895   | 0.7903   | 0.9212   | 0.8431          | 0.9694          | 0.7572       | 0.8776       |
+| 0.0016        | 16.0  | 1488 | 0.1059          | 0.9898   | 0.7901   | 0.9235   | 0.8434          | 0.9744          | 0.7572       | 0.8776       |
+| 0.0014        | 17.0  | 1581 | 0.1063          | 0.9898   | 0.7924   | 0.9235   | 0.8472          | 0.9744          | 0.7572       | 0.8776       |
+| 0.001         | 18.0  | 1674 | 0.1052          | 0.9895   | 0.7899   | 0.9212   | 0.8429          | 0.9694          | 0.7572       | 0.8776       |
 ### Framework versions

config.json CHANGED Viewed

@@ -27,93 +27,91 @@
     "14": "I-R:PUNCT",
     "15": "B-R:SPELL",
     "16": "B-U:PRON",
-    "17": "I-R:SPELL",
-    "18": "B-R:WO",
-    "19": "I-R:MORPH",
-    "20": "B-R:VERB:TENSE",
-    "21": "B-R:NOUN",
-    "22": "I-R:OTHER",
-    "23": "B-U:DET",
-    "24": "B-U:PART",
-    "25": "B-R:ADV",
-    "26": "I-R:VERB:SVA",
-    "27": "I-R:DET",
-    "28": "B-R:NOUN:NUM",
-    "29": "O",
-    "30": "B-R:ADJ",
-    "31": "B-U:VERB:TENSE",
-    "32": "B-R:PRON",
-    "33": "I-U:VERB",
-    "34": "I-R:ADV",
-    "35": "I-R:VERB:FORM",
-    "36": "B-R:OTHER",
-    "37": "B-U:VERB:FORM",
-    "38": "B-U:ADV",
-    "39": "B-R:NOUN:INFL",
-    "40": "B-R:PART",
-    "41": "B-U:OTHER",
-    "42": "I-R:VERB",
-    "43": "B-R:PUNCT",
-    "44": "B-R:VERB",
-    "45": "B-R:DET",
-    "46": "B-R:MORPH",
-    "47": "I-R:NOUN",
-    "48": "B-R:VERB:FORM",
-    "49": "B-R:ADJ:FORM"
   },
   "initializer_range": 0.02,
   "intermediate_size": 3072,
   "label2id": {
-    "B-R:ADJ": 30,
-    "B-R:ADJ:FORM": 49,
-    "B-R:ADV": 25,
-    "B-R:DET": 45,
-    "B-R:MORPH": 46,
-    "B-R:NOUN": 21,
-    "B-R:NOUN:INFL": 39,
-    "B-R:NOUN:NUM": 28,
-    "B-R:OTHER": 36,
-    "B-R:PART": 40,
     "B-R:PREP": 11,
-    "B-R:PRON": 32,
-    "B-R:PUNCT": 43,
     "B-R:SPELL": 15,
-    "B-R:VERB": 44,
-    "B-R:VERB:FORM": 48,
     "B-R:VERB:INFL": 7,
     "B-R:VERB:SVA": 9,
-    "B-R:VERB:TENSE": 20,
-    "B-R:WO": 18,
-    "B-U:ADV": 38,
     "B-U:CONJ": 13,
-    "B-U:DET": 23,
     "B-U:NOUN": 10,
-    "B-U:OTHER": 41,
-    "B-U:PART": 24,
     "B-U:PREP": 0,
     "B-U:PRON": 16,
     "B-U:VERB": 6,
-    "B-U:VERB:FORM": 37,
-    "B-U:VERB:TENSE": 31,
-    "I-R:ADV": 34,
-    "I-R:DET": 27,
-    "I-R:MORPH": 19,
-    "I-R:NOUN": 47,
     "I-R:NOUN:INFL": 2,
-    "I-R:OTHER": 22,
     "I-R:PUNCT": 14,
-    "I-R:SPELL": 17,
-    "I-R:VERB": 42,
-    "I-R:VERB:FORM": 35,
     "I-R:VERB:INFL": 8,
-    "I-R:VERB:SVA": 26,
     "I-R:VERB:TENSE": 3,
     "I-R:WO": 4,
     "I-U:NOUN": 12,
     "I-U:OTHER": 5,
-    "I-U:VERB": 33,
     "I-U:VERB:TENSE": 1,
-    "O": 29
   },
   "layer_norm_eps": 1e-12,
   "max_position_embeddings": 512,

     "14": "I-R:PUNCT",
     "15": "B-R:SPELL",
     "16": "B-U:PRON",
+    "17": "B-R:WO",
+    "18": "I-R:MORPH",
+    "19": "B-R:VERB:TENSE",
+    "20": "B-R:NOUN",
+    "21": "I-R:OTHER",
+    "22": "B-U:DET",
+    "23": "B-U:PART",
+    "24": "B-R:ADV",
+    "25": "I-R:VERB:SVA",
+    "26": "I-R:DET",
+    "27": "B-R:NOUN:NUM",
+    "28": "O",
+    "29": "B-R:ADJ",
+    "30": "B-U:VERB:TENSE",
+    "31": "B-R:PRON",
+    "32": "I-U:VERB",
+    "33": "I-R:ADV",
+    "34": "I-R:VERB:FORM",
+    "35": "B-R:OTHER",
+    "36": "B-U:VERB:FORM",
+    "37": "B-U:ADV",
+    "38": "B-R:NOUN:INFL",
+    "39": "B-R:PART",
+    "40": "B-U:OTHER",
+    "41": "I-R:VERB",
+    "42": "B-R:PUNCT",
+    "43": "B-R:VERB",
+    "44": "B-R:DET",
+    "45": "B-R:MORPH",
+    "46": "I-R:NOUN",
+    "47": "B-R:VERB:FORM",
+    "48": "B-R:ADJ:FORM"
   },
   "initializer_range": 0.02,
   "intermediate_size": 3072,
   "label2id": {
+    "B-R:ADJ": 29,
+    "B-R:ADJ:FORM": 48,
+    "B-R:ADV": 24,
+    "B-R:DET": 44,
+    "B-R:MORPH": 45,
+    "B-R:NOUN": 20,
+    "B-R:NOUN:INFL": 38,
+    "B-R:NOUN:NUM": 27,
+    "B-R:OTHER": 35,
+    "B-R:PART": 39,
     "B-R:PREP": 11,
+    "B-R:PRON": 31,
+    "B-R:PUNCT": 42,
     "B-R:SPELL": 15,
+    "B-R:VERB": 43,
+    "B-R:VERB:FORM": 47,
     "B-R:VERB:INFL": 7,
     "B-R:VERB:SVA": 9,
+    "B-R:VERB:TENSE": 19,
+    "B-R:WO": 17,
+    "B-U:ADV": 37,
     "B-U:CONJ": 13,
+    "B-U:DET": 22,
     "B-U:NOUN": 10,
+    "B-U:OTHER": 40,
+    "B-U:PART": 23,
     "B-U:PREP": 0,
     "B-U:PRON": 16,
     "B-U:VERB": 6,
+    "B-U:VERB:FORM": 36,
+    "B-U:VERB:TENSE": 30,
+    "I-R:ADV": 33,
+    "I-R:DET": 26,
+    "I-R:MORPH": 18,
+    "I-R:NOUN": 46,
     "I-R:NOUN:INFL": 2,
+    "I-R:OTHER": 21,
     "I-R:PUNCT": 14,
+    "I-R:VERB": 41,
+    "I-R:VERB:FORM": 34,
     "I-R:VERB:INFL": 8,
+    "I-R:VERB:SVA": 25,
     "I-R:VERB:TENSE": 3,
     "I-R:WO": 4,
     "I-U:NOUN": 12,
     "I-U:OTHER": 5,
+    "I-U:VERB": 32,
     "I-U:VERB:TENSE": 1,
+    "O": 28
   },
   "layer_norm_eps": 1e-12,
   "max_position_embeddings": 512,

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:898ad17c5286bdcb31b773b2aaaa66a85e4495c16dcd5f78404e3a492b04d3d9
-size 435743736

 version https://git-lfs.github.com/spec/v1
+oid sha256:ab820c4efd09dcf60ee9c2b9bb3a9f9b68f8f81aefb1c047b73b40856c6465b6
+size 435740660

runs/Dec12_22-43-39_a365e7b9463b/events.out.tfevents.1734043420.a365e7b9463b.6288.9 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:10fca3a7cf48b5b7749af360c691a761512f0152eaf9abacaab054cd4912c407
+size 23264

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fba559b60c5d760413ca4c35858fba48e69260c499152a0432bcbe8cfdd2f1d6
 size 5304

 version https://git-lfs.github.com/spec/v1
+oid sha256:b0652214a44dd34e8b6c9dda375d7c44a9fb9ca509a02f4ca662f6432266dd72
 size 5304