Finished training

Browse files

Files changed (8) hide show

README.md +72 -0
config.json +79 -0
model.safetensors +3 -0
special_tokens_map.json +7 -0
tokenizer.json +0 -0
tokenizer_config.json +55 -0
training_args.bin +3 -0
vocab.txt +0 -0

README.md ADDED Viewed

	@@ -0,0 +1,72 @@

+---
+license: mit
+base_model: google-bert/bert-base-german-cased
+tags:
+- generated_from_trainer
+model-index:
+- name: bert-mapa-german
+ results: []
+---
+<!-- This model card has been generated automatically according to the information the Trainer had access to. You
+should probably proofread and complete it, then remove this comment. -->
+# bert-mapa-german
+This model is a fine-tuned version of [google-bert/bert-base-german-cased](https://huggingface.co/google-bert/bert-base-german-cased) on the None dataset.
+It achieves the following results on the evaluation set:
+- Loss: 0.0325
+- Address: {'precision': 0.5882352941176471, 'recall': 0.6666666666666666, 'f1': 0.625, 'number': 15}
+- Age: {'precision': 0.0, 'recall': 0.0, 'f1': 0.0, 'number': 3}
+- Amount: {'precision': 1.0, 'recall': 1.0, 'f1': 1.0, 'number': 1}
+- Date: {'precision': 0.9454545454545454, 'recall': 0.9454545454545454, 'f1': 0.9454545454545454, 'number': 55}
+- Name: {'precision': 0.7, 'recall': 0.9545454545454546, 'f1': 0.8076923076923077, 'number': 22}
+- Organisation: {'precision': 0.5405405405405406, 'recall': 0.6451612903225806, 'f1': 0.588235294117647, 'number': 31}
+- Person: {'precision': 0.5384615384615384, 'recall': 0.5, 'f1': 0.5185185185185186, 'number': 14}
+- Role: {'precision': 0.0, 'recall': 0.0, 'f1': 0.0, 'number': 1}
+- Overall Precision: 0.7255
+- Overall Recall: 0.7817
+- Overall F1: 0.7525
+- Overall Accuracy: 0.9912
+## Model description
+More information needed
+## Intended uses & limitations
+More information needed
+## Training and evaluation data
+More information needed
+## Training procedure
+### Training hyperparameters
+The following hyperparameters were used during training:
+- learning_rate: 2e-05
+- train_batch_size: 8
+- eval_batch_size: 8
+- seed: 42
+- optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
+- lr_scheduler_type: linear
+- num_epochs: 4
+### Training results
+| Training Loss | Epoch | Step | Validation Loss | Address | Amount | Date | Marital status | Name | Organisation | Person | Profession | Role | Overall Precision | Overall Recall | Overall F1 | Overall Accuracy |
+|:-------------:|:-----:|:----:|:---------------:|:------------------------------------------------------------------------------------------:|:---------------------------------------------------------:|:-------------------------------------------------------------------------------------------------------:|:---------------------------------------------------------:|:-------------------------------------------------------------------------------------------------------:|:------------------------------------------------------------------------------------------:|:-------------------------------------------------------------------------------------------------------:|:---------------------------------------------------------:|:---------------------------------------------------------:|:-----------------:|:--------------:|:----------:|:----------------:|
+| No log | 1.0 | 218 | 0.0607 | {'precision': 0.5882352941176471, 'recall': 0.6666666666666666, 'f1': 0.625, 'number': 15} | {'precision': 1.0, 'recall': 1.0, 'f1': 1.0, 'number': 3} | {'precision': 0.851063829787234, 'recall': 0.9090909090909091, 'f1': 0.8791208791208791, 'number': 44} | {'precision': 0.0, 'recall': 0.0, 'f1': 0.0, 'number': 2} | {'precision': 0.76, 'recall': 0.9047619047619048, 'f1': 0.8260869565217391, 'number': 21} | {'precision': 0.4915254237288136, 'recall': 0.725, 'f1': 0.5858585858585859, 'number': 40} | {'precision': 0.5, 'recall': 0.6153846153846154, 'f1': 0.5517241379310345, 'number': 13} | {'precision': 0.0, 'recall': 0.0, 'f1': 0.0, 'number': 1} | {'precision': 0.0, 'recall': 0.0, 'f1': 0.0, 'number': 1} | 0.6527 | 0.7786 | 0.7101 | 0.9859 |
+| No log | 2.0 | 436 | 0.0479 | {'precision': 0.65, 'recall': 0.8666666666666667, 'f1': 0.7428571428571429, 'number': 15} | {'precision': 1.0, 'recall': 1.0, 'f1': 1.0, 'number': 3} | {'precision': 0.8958333333333334, 'recall': 0.9772727272727273, 'f1': 0.9347826086956522, 'number': 44} | {'precision': 0.0, 'recall': 0.0, 'f1': 0.0, 'number': 2} | {'precision': 0.6774193548387096, 'recall': 1.0, 'f1': 0.8076923076923077, 'number': 21} | {'precision': 0.5897435897435898, 'recall': 0.575, 'f1': 0.5822784810126582, 'number': 40} | {'precision': 0.7857142857142857, 'recall': 0.8461538461538461, 'f1': 0.8148148148148148, 'number': 13} | {'precision': 0.0, 'recall': 0.0, 'f1': 0.0, 'number': 1} | {'precision': 0.0, 'recall': 0.0, 'f1': 0.0, 'number': 1} | 0.7355 | 0.8143 | 0.7729 | 0.9896 |
+| 0.116 | 3.0 | 654 | 0.0414 | {'precision': 0.65, 'recall': 0.8666666666666667, 'f1': 0.7428571428571429, 'number': 15} | {'precision': 1.0, 'recall': 1.0, 'f1': 1.0, 'number': 3} | {'precision': 0.8958333333333334, 'recall': 0.9772727272727273, 'f1': 0.9347826086956522, 'number': 44} | {'precision': 0.0, 'recall': 0.0, 'f1': 0.0, 'number': 2} | {'precision': 0.7407407407407407, 'recall': 0.9523809523809523, 'f1': 0.8333333333333334, 'number': 21} | {'precision': 0.725, 'recall': 0.725, 'f1': 0.7250000000000001, 'number': 40} | {'precision': 0.6666666666666666, 'recall': 0.7692307692307693, 'f1': 0.7142857142857142, 'number': 13} | {'precision': 0.0, 'recall': 0.0, 'f1': 0.0, 'number': 1} | {'precision': 0.0, 'recall': 0.0, 'f1': 0.0, 'number': 1} | 0.7712 | 0.8429 | 0.8055 | 0.9908 |
+| 0.116 | 4.0 | 872 | 0.0421 | {'precision': 0.65, 'recall': 0.8666666666666667, 'f1': 0.7428571428571429, 'number': 15} | {'precision': 1.0, 'recall': 1.0, 'f1': 1.0, 'number': 3} | {'precision': 0.8958333333333334, 'recall': 0.9772727272727273, 'f1': 0.9347826086956522, 'number': 44} | {'precision': 0.0, 'recall': 0.0, 'f1': 0.0, 'number': 2} | {'precision': 0.8, 'recall': 0.9523809523809523, 'f1': 0.8695652173913043, 'number': 21} | {'precision': 0.6818181818181818, 'recall': 0.75, 'f1': 0.7142857142857143, 'number': 40} | {'precision': 0.8571428571428571, 'recall': 0.9230769230769231, 'f1': 0.888888888888889, 'number': 13} | {'precision': 0.0, 'recall': 0.0, 'f1': 0.0, 'number': 1} | {'precision': 0.0, 'recall': 0.0, 'f1': 0.0, 'number': 1} | 0.7857 | 0.8643 | 0.8231 | 0.9917 |
+### Framework versions
+- Transformers 4.40.0
+- Pytorch 2.1.0+cu121
+- Datasets 2.19.0
+- Tokenizers 0.19.1

config.json ADDED Viewed

	@@ -0,0 +1,79 @@

+{
+ "_name_or_path": "google-bert/bert-base-german-cased",
+ "architectures": [
+ "BertForTokenClassification"
+ ],
+ "attention_probs_dropout_prob": 0.1,
+ "classifier_dropout": null,
+ "hidden_act": "gelu",
+ "hidden_dropout_prob": 0.1,
+ "hidden_size": 768,
+ "id2label": {
+ "0": "O",
+ "1": "B-ADDRESS",
+ "2": "I-ADDRESS",
+ "3": "B-DATE",
+ "4": "I-DATE",
+ "5": "B-ORGANISATION",
+ "6": "I-ORGANISATION",
+ "7": "B-NAME",
+ "8": "I-NAME",
+ "9": "B-PERSON",
+ "10": "I-PERSON",
+ "11": "B-ROLE",
+ "12": "I-ROLE",
+ "13": "B-PROFESSION",
+ "14": "I-PROFESSION",
+ "15": "B-AMOUNT",
+ "16": "I-AMOUNT",
+ "17": "B-AGE",
+ "18": "I-AGE",
+ "19": "B-MARITAL STATUS",
+ "20": "I-MARITAL STATUS",
+ "21": "B-ETHNIC CATEGORY",
+ "22": "I-ETHNIC CATEGORY",
+ "23": "B-NATIONALITY",
+ "24": "I-NATIONALITY"
+ },
+ "initializer_range": 0.02,
+ "intermediate_size": 3072,
+ "label2id": {
+ "B-ADDRESS": 1,
+ "B-AGE": 17,
+ "B-AMOUNT": 15,
+ "B-DATE": 3,
+ "B-ETHNIC CATEGORY": 21,
+ "B-MARITAL STATUS": 19,
+ "B-NAME": 7,
+ "B-NATIONALITY": 23,
+ "B-ORGANISATION": 5,
+ "B-PERSON": 9,
+ "B-PROFESSION": 13,
+ "B-ROLE": 11,
+ "I-ADDRESS": 2,
+ "I-AGE": 18,
+ "I-AMOUNT": 16,
+ "I-DATE": 4,
+ "I-ETHNIC CATEGORY": 22,
+ "I-MARITAL STATUS": 20,
+ "I-NAME": 8,
+ "I-NATIONALITY": 24,
+ "I-ORGANISATION": 6,
+ "I-PERSON": 10,
+ "I-PROFESSION": 14,
+ "I-ROLE": 12,
+ "O": 0
+ },
+ "layer_norm_eps": 1e-12,
+ "max_position_embeddings": 512,
+ "model_type": "bert",
+ "num_attention_heads": 12,
+ "num_hidden_layers": 12,
+ "pad_token_id": 0,
+ "position_embedding_type": "absolute",
+ "torch_dtype": "float32",
+ "transformers_version": "4.40.0",
+ "type_vocab_size": 2,
+ "use_cache": true,
+ "vocab_size": 30000
+}

model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9057eb525021c8fbd2d8c9e244f581bc9edf48d5bed2717d07dc6962020d6cd7
+size 434063252

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+ "cls_token": "[CLS]",
+ "mask_token": "[MASK]",
+ "pad_token": "[PAD]",
+ "sep_token": "[SEP]",
+ "unk_token": "[UNK]"
+}

tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,55 @@

+{
+ "added_tokens_decoder": {
+ "0": {
+ "content": "[PAD]",
+ "lstrip": false,
+ "normalized": false,
+ "rstrip": false,
+ "single_word": false,
+ "special": true
+ },
+ "2": {
+ "content": "[UNK]",
+ "lstrip": false,
+ "normalized": false,
+ "rstrip": false,
+ "single_word": false,
+ "special": true
+ },
+ "3": {
+ "content": "[CLS]",
+ "lstrip": false,
+ "normalized": false,
+ "rstrip": false,
+ "single_word": false,
+ "special": true
+ },
+ "4": {
+ "content": "[SEP]",
+ "lstrip": false,
+ "normalized": false,
+ "rstrip": false,
+ "single_word": false,
+ "special": true
+ },
+ "5": {
+ "content": "[MASK]",
+ "lstrip": false,
+ "normalized": false,
+ "rstrip": false,
+ "single_word": false,
+ "special": true
+ }
+ },
+ "clean_up_tokenization_spaces": true,
+ "cls_token": "[CLS]",
+ "do_lower_case": false,
+ "mask_token": "[MASK]",
+ "model_max_length": 512,
+ "pad_token": "[PAD]",
+ "sep_token": "[SEP]",
+ "strip_accents": null,
+ "tokenize_chinese_chars": true,
+ "tokenizer_class": "BertTokenizer",
+ "unk_token": "[UNK]"
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ff9df7507025cdc300d4ca63aef319fb27233fa244fc064689e7f53443c8ec24
+size 4984

vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff