pierreguillou
/

lilt-xlm-roberta-base-finetuned-with-DocLayNet-base-at-paragraphlevel-ml512

Model card Files Files and versions Metrics Training metrics Community

pierreguillou commited on Feb 15, 2023

Commit

7419b6c

•

1 Parent(s): 0a6fb58

Training in progress, step 1800

Browse files

Files changed (24) hide show

{checkpoint-1200 → checkpoint-1700}/config.json +0 -0
{checkpoint-1200 → checkpoint-1700}/optimizer.pt +1 -1
{checkpoint-1300 → checkpoint-1700}/pytorch_model.bin +1 -1
{checkpoint-1300 → checkpoint-1700}/rng_state.pth +1 -1
{checkpoint-1300 → checkpoint-1700}/scaler.pt +1 -1
{checkpoint-1200 → checkpoint-1700}/scheduler.pt +1 -1
{checkpoint-1200 → checkpoint-1700}/special_tokens_map.json +0 -0
{checkpoint-1200 → checkpoint-1700}/tokenizer.json +0 -0
{checkpoint-1200 → checkpoint-1700}/tokenizer_config.json +0 -0
{checkpoint-1300 → checkpoint-1700}/trainer_state.json +57 -3
{checkpoint-1200 → checkpoint-1700}/training_args.bin +0 -0
{checkpoint-1300 → checkpoint-1800}/config.json +0 -0
{checkpoint-1300 → checkpoint-1800}/optimizer.pt +1 -1
{checkpoint-1200 → checkpoint-1800}/pytorch_model.bin +1 -1
{checkpoint-1200 → checkpoint-1800}/rng_state.pth +1 -1
{checkpoint-1200 → checkpoint-1800}/scaler.pt +1 -1
{checkpoint-1300 → checkpoint-1800}/scheduler.pt +1 -1
{checkpoint-1300 → checkpoint-1800}/special_tokens_map.json +0 -0
{checkpoint-1300 → checkpoint-1800}/tokenizer.json +0 -0
{checkpoint-1300 → checkpoint-1800}/tokenizer_config.json +0 -0
{checkpoint-1200 → checkpoint-1800}/trainer_state.json +81 -3
{checkpoint-1300 → checkpoint-1800}/training_args.bin +0 -0
pytorch_model.bin +1 -1
runs/Feb15_07-53-26_e220f522c880/events.out.tfevents.1676447621.e220f522c880.495.0 +2 -2

{checkpoint-1200 → checkpoint-1700}/config.json RENAMED Viewed

File without changes

{checkpoint-1200 → checkpoint-1700}/optimizer.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:280a221cc64b57effe5c7a796f38b48321fed8fcb3ff1e239c462a69ff81116c
 size 2265828101

 version https://git-lfs.github.com/spec/v1
+oid sha256:729004fcf99456996b5021ebe5a947784fe395af38a311463a6c8394258a65e1
 size 2265828101

{checkpoint-1300 → checkpoint-1700}/pytorch_model.bin RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7d4698a9bcd9f4d1b85cd29935ce42f4264d331bc9713045308140215396cd2e
 size 1134425553

 version https://git-lfs.github.com/spec/v1
+oid sha256:071823a09cad0d0ee1a84e696398cf09288e9b6d735bcc30cdd2d342f3f51d7b
 size 1134425553

{checkpoint-1300 → checkpoint-1700}/rng_state.pth RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:55d131675f12693ae085c3c3a36adf556143b9deea694fe5308eef74c5dc9628
 size 14575

 version https://git-lfs.github.com/spec/v1
+oid sha256:601d09199bbd913a7215c8cba0939124457c2a49e668a60ddf927eb5c0634883
 size 14575

{checkpoint-1300 → checkpoint-1700}/scaler.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:af7a31e9f5bbee16af877be66fd13ae4491e1f0e57f209ceef7ac824ca84139d
 size 557

 version https://git-lfs.github.com/spec/v1
+oid sha256:3bd9cd8c155d5657070f8ed265a80ce72d9d2060869298c24c5bdd0b74109812
 size 557

{checkpoint-1200 → checkpoint-1700}/scheduler.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:29a2c927b05979c18fd3e62e50ba927b4a9c741248dda26234d8cd08f20d64a8
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:52c3445de958aa8136571bb30deff20a540a52b3340cc380d53bac08e004773d
 size 627

{checkpoint-1200 → checkpoint-1700}/special_tokens_map.json RENAMED Viewed

File without changes

{checkpoint-1200 → checkpoint-1700}/tokenizer.json RENAMED Viewed

File without changes

{checkpoint-1200 → checkpoint-1700}/tokenizer_config.json RENAMED Viewed

File without changes

{checkpoint-1300 → checkpoint-1700}/trainer_state.json RENAMED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": 0.885723696687195,
   "best_model_checkpoint": "DocLayNet/lilt-xlm-roberta-base-finetuned-DocLayNet-base_paragraphs_ml512-v5/checkpoint-600",
-  "epoch": 0.6929637526652452,
-  "global_step": 1300,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -174,11 +174,65 @@
       "eval_samples_per_second": 40.44,
       "eval_steps_per_second": 2.542,
       "step": 1300
     }
   ],
   "max_steps": 1876,
   "num_train_epochs": 1,
-  "total_flos": 2892991284019200.0,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": 0.885723696687195,
   "best_model_checkpoint": "DocLayNet/lilt-xlm-roberta-base-finetuned-DocLayNet-base_paragraphs_ml512-v5/checkpoint-600",
+  "epoch": 0.906183368869936,
+  "global_step": 1700,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 40.44,
       "eval_steps_per_second": 2.542,
       "step": 1300
+    },
+    {
+      "epoch": 0.75,
+      "eval_accuracy": 0.874334993562039,
+      "eval_f1": 0.874334993562039,
+      "eval_loss": 0.4129931926727295,
+      "eval_precision": 0.874334993562039,
+      "eval_recall": 0.874334993562039,
+      "eval_runtime": 44.8477,
+      "eval_samples_per_second": 35.832,
+      "eval_steps_per_second": 2.252,
+      "step": 1400
+    },
+    {
+      "epoch": 0.8,
+      "learning_rate": 4.051172707889126e-06,
+      "loss": 0.3672,
+      "step": 1500
+    },
+    {
+      "epoch": 0.8,
+      "eval_accuracy": 0.8288799944104525,
+      "eval_f1": 0.8288799944104525,
+      "eval_loss": 0.45351940393447876,
+      "eval_precision": 0.8288799944104525,
+      "eval_recall": 0.8288799944104525,
+      "eval_runtime": 45.3573,
+      "eval_samples_per_second": 35.43,
+      "eval_steps_per_second": 2.227,
+      "step": 1500
+    },
+    {
+      "epoch": 0.85,
+      "eval_accuracy": 0.8712607424116902,
+      "eval_f1": 0.8712607424116902,
+      "eval_loss": 0.36811864376068115,
+      "eval_precision": 0.8712607424116902,
+      "eval_recall": 0.8712607424116902,
+      "eval_runtime": 44.3035,
+      "eval_samples_per_second": 36.273,
+      "eval_steps_per_second": 2.28,
+      "step": 1600
+    },
+    {
+      "epoch": 0.91,
+      "eval_accuracy": 0.885723696687195,
+      "eval_f1": 0.885723696687195,
+      "eval_loss": 0.34459415078163147,
+      "eval_precision": 0.885723696687195,
+      "eval_recall": 0.885723696687195,
+      "eval_runtime": 44.6077,
+      "eval_samples_per_second": 36.025,
+      "eval_steps_per_second": 2.264,
+      "step": 1700
     }
   ],
   "max_steps": 1876,
   "num_train_epochs": 1,
+  "total_flos": 3783142448332800.0,
   "trial_name": null,
   "trial_params": null
 }

{checkpoint-1200 → checkpoint-1700}/training_args.bin RENAMED Viewed

File without changes

{checkpoint-1300 → checkpoint-1800}/config.json RENAMED Viewed

File without changes

{checkpoint-1300 → checkpoint-1800}/optimizer.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2c08cf141a111f37d0566da69d0c30d72707ecd26196f04456a9b2121b4d97d3
 size 2265828101

 version https://git-lfs.github.com/spec/v1
+oid sha256:420937e4631c6307bb20626a94737518c49ba06b50213dcba5ba3656760807c6
 size 2265828101

{checkpoint-1200 → checkpoint-1800}/pytorch_model.bin RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:129796804ce986931f94bfed0dab6f25dddc2e97c3a332294d4f52bf3528c96a
 size 1134425553

 version https://git-lfs.github.com/spec/v1
+oid sha256:e0ce50e2c3bc965514eb957251870b9e018aa89a1eb3c0b2d421e00f4020f51b
 size 1134425553

{checkpoint-1200 → checkpoint-1800}/rng_state.pth RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:cd6ffa5eb17c8d65486aa60854f05719c6a9abb0d32d2839b3ba42058bd6991d
 size 14575

 version https://git-lfs.github.com/spec/v1
+oid sha256:1adfb71bc946adddba7d7a4adf2692f3ecca6f938e6cec06e55e91f7eded59d3
 size 14575

{checkpoint-1200 → checkpoint-1800}/scaler.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6b74d76706ac346849ec903aa334b83db05c630c620b87dcbe1a7b129aecd1c1
 size 557

 version https://git-lfs.github.com/spec/v1
+oid sha256:9cc6b9e5879ad27aed996bd80d0156e04156a49f5d5c05c63381b2d7ef1e56ee
 size 557

{checkpoint-1300 → checkpoint-1800}/scheduler.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:893ff4c60fcbf7662c0d4334e0bfce704fb88be1f6c471b5adc0626650efe85d
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:bdd460548c31edca36710a211911ae5cae45a7d2e78b27979617c353a46d75e9
 size 627

{checkpoint-1300 → checkpoint-1800}/special_tokens_map.json RENAMED Viewed

File without changes

{checkpoint-1300 → checkpoint-1800}/tokenizer.json RENAMED Viewed

File without changes

{checkpoint-1300 → checkpoint-1800}/tokenizer_config.json RENAMED Viewed

File without changes

{checkpoint-1200 → checkpoint-1800}/trainer_state.json RENAMED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": 0.885723696687195,
   "best_model_checkpoint": "DocLayNet/lilt-xlm-roberta-base-finetuned-DocLayNet-base_paragraphs_ml512-v5/checkpoint-600",
-  "epoch": 0.6396588486140725,
-  "global_step": 1200,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -162,11 +162,89 @@
       "eval_samples_per_second": 35.614,
       "eval_steps_per_second": 2.238,
       "step": 1200
     }
   ],
   "max_steps": 1876,
   "num_train_epochs": 1,
-  "total_flos": 2670453492940800.0,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": 0.885723696687195,
   "best_model_checkpoint": "DocLayNet/lilt-xlm-roberta-base-finetuned-DocLayNet-base_paragraphs_ml512-v5/checkpoint-600",
+  "epoch": 0.9594882729211087,
+  "global_step": 1800,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 35.614,
       "eval_steps_per_second": 2.238,
       "step": 1200
+    },
+    {
+      "epoch": 0.69,
+      "eval_accuracy": 0.8612794075079601,
+      "eval_f1": 0.8612794075079601,
+      "eval_loss": 0.41840043663978577,
+      "eval_precision": 0.8612794075079601,
+      "eval_recall": 0.8612794075079601,
+      "eval_runtime": 39.7377,
+      "eval_samples_per_second": 40.44,
+      "eval_steps_per_second": 2.542,
+      "step": 1300
+    },
+    {
+      "epoch": 0.75,
+      "eval_accuracy": 0.874334993562039,
+      "eval_f1": 0.874334993562039,
+      "eval_loss": 0.4129931926727295,
+      "eval_precision": 0.874334993562039,
+      "eval_recall": 0.874334993562039,
+      "eval_runtime": 44.8477,
+      "eval_samples_per_second": 35.832,
+      "eval_steps_per_second": 2.252,
+      "step": 1400
+    },
+    {
+      "epoch": 0.8,
+      "learning_rate": 4.051172707889126e-06,
+      "loss": 0.3672,
+      "step": 1500
+    },
+    {
+      "epoch": 0.8,
+      "eval_accuracy": 0.8288799944104525,
+      "eval_f1": 0.8288799944104525,
+      "eval_loss": 0.45351940393447876,
+      "eval_precision": 0.8288799944104525,
+      "eval_recall": 0.8288799944104525,
+      "eval_runtime": 45.3573,
+      "eval_samples_per_second": 35.43,
+      "eval_steps_per_second": 2.227,
+      "step": 1500
+    },
+    {
+      "epoch": 0.85,
+      "eval_accuracy": 0.8712607424116902,
+      "eval_f1": 0.8712607424116902,
+      "eval_loss": 0.36811864376068115,
+      "eval_precision": 0.8712607424116902,
+      "eval_recall": 0.8712607424116902,
+      "eval_runtime": 44.3035,
+      "eval_samples_per_second": 36.273,
+      "eval_steps_per_second": 2.28,
+      "step": 1600
+    },
+    {
+      "epoch": 0.91,
+      "eval_accuracy": 0.885723696687195,
+      "eval_f1": 0.885723696687195,
+      "eval_loss": 0.34459415078163147,
+      "eval_precision": 0.885723696687195,
+      "eval_recall": 0.885723696687195,
+      "eval_runtime": 44.6077,
+      "eval_samples_per_second": 36.025,
+      "eval_steps_per_second": 2.264,
+      "step": 1700
+    },
+    {
+      "epoch": 0.96,
+      "eval_accuracy": 0.8634353758471658,
+      "eval_f1": 0.8634353758471657,
+      "eval_loss": 0.41038718819618225,
+      "eval_precision": 0.8634353758471658,
+      "eval_recall": 0.8634353758471658,
+      "eval_runtime": 40.0758,
+      "eval_samples_per_second": 40.099,
+      "eval_steps_per_second": 2.52,
+      "step": 1800
     }
   ],
   "max_steps": 1876,
   "num_train_epochs": 1,
+  "total_flos": 4005680239411200.0,
   "trial_name": null,
   "trial_params": null
 }

{checkpoint-1300 → checkpoint-1800}/training_args.bin RENAMED Viewed

File without changes

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7d4698a9bcd9f4d1b85cd29935ce42f4264d331bc9713045308140215396cd2e
 size 1134425553

 version https://git-lfs.github.com/spec/v1
+oid sha256:e0ce50e2c3bc965514eb957251870b9e018aa89a1eb3c0b2d421e00f4020f51b
 size 1134425553

runs/Feb15_07-53-26_e220f522c880/events.out.tfevents.1676447621.e220f522c880.495.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:aec79be76242a342cf813e35be39731a4cf8ff91fe61776b977f2529b2fa0e92
-size 11114

 version https://git-lfs.github.com/spec/v1
+oid sha256:e10b4927301c942673e8c171300cc1481b2f2efdb1f5cf8e239edc99ad8f3db1
+size 13631