Training complete

Files changed (4) hide show

README.md CHANGED Viewed

@@ -1,4 +1,5 @@
 ---
 license: apache-2.0
 base_model: Helsinki-NLP/opus-mt-en-fr
 tags:
@@ -6,9 +7,24 @@ tags:
 - generated_from_trainer
 datasets:
 - kde4
 model-index:
 - name: marian-finetuned-kde4-en-to-fr
-  results: []
 ---
 <!-- This model card has been generated automatically according to the information the Trainer had access to. You
@@ -18,12 +34,9 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [Helsinki-NLP/opus-mt-en-fr](https://huggingface.co/Helsinki-NLP/opus-mt-en-fr) on the kde4 dataset.
 It achieves the following results on the evaluation set:
-- eval_loss: 1.6978
-- eval_bleu: 39.2712
-- eval_runtime: 558.844
-- eval_samples_per_second: 37.61
-- eval_steps_per_second: 0.295
-- step: 0
 ## Model description
@@ -43,17 +56,21 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 2e-05
-- train_batch_size: 64
-- eval_batch_size: 128
 - seed: 42
-- optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - num_epochs: 3
 - mixed_precision_training: Native AMP
 ### Framework versions
-- Transformers 4.40.2
-- Pytorch 2.3.0+cu121
-- Datasets 2.19.1
-- Tokenizers 0.19.1

 ---
+library_name: transformers
 license: apache-2.0
 base_model: Helsinki-NLP/opus-mt-en-fr
 tags:
 - generated_from_trainer
 datasets:
 - kde4
+metrics:
+- bleu
 model-index:
 - name: marian-finetuned-kde4-en-to-fr
+  results:
+  - task:
+      name: Sequence-to-sequence Language Modeling
+      type: text2text-generation
+    dataset:
+      name: kde4
+      type: kde4
+      config: en-fr
+      split: train
+      args: en-fr
+    metrics:
+    - name: Bleu
+      type: bleu
+      value: 52.90204973205105
 ---
 <!-- This model card has been generated automatically according to the information the Trainer had access to. You
 This model is a fine-tuned version of [Helsinki-NLP/opus-mt-en-fr](https://huggingface.co/Helsinki-NLP/opus-mt-en-fr) on the kde4 dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.8554
+- Model Preparation Time: 0.0156
+- Bleu: 52.9020
 ## Model description
 The following hyperparameters were used during training:
 - learning_rate: 2e-05
+- train_batch_size: 32
+- eval_batch_size: 64
 - seed: 42
+- optimizer: Use adamw_torch with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
 - num_epochs: 3
 - mixed_precision_training: Native AMP
+### Training results
 ### Framework versions
+- Transformers 4.46.3
+- Pytorch 2.5.1+cu121
+- Datasets 3.1.0
+- Tokenizers 0.20.3

generation_config.json CHANGED Viewed

@@ -12,5 +12,5 @@
   "num_beams": 4,
   "pad_token_id": 59513,
   "renormalize_logits": true,
-  "transformers_version": "4.40.2"
 }

   "num_beams": 4,
   "pad_token_id": 59513,
   "renormalize_logits": true,
+  "transformers_version": "4.46.3"
 }

runs/Dec10_06-32-16_043e7362f896/events.out.tfevents.1733813924.043e7362f896.754.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7562328282a37a7be6bd06a511ed6208772b5f91f89999ca60b369b0cb3b4b4c
-size 13722

 version https://git-lfs.github.com/spec/v1
+oid sha256:5a007289fe71f7efba54efe9f3b71d0de373fdc13881273bb910af91bb83aaab
+size 14082

runs/Dec10_06-32-16_043e7362f896/events.out.tfevents.1733819148.043e7362f896.754.1 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:d6c050318d0b778473cafcd528760fa1b6034a6da65031e5e45dfbc65667f75f
+size 480