The cache for model files in Transformers v4.22.0 has been updated. Migrating your old cache. This is a one-time only operation. You can interrupt this and resume the migration later on by calling `transformers.utils.move_cache()`.
0it [00:00, ?it/s]0it [00:00, ?it/s]
/opt/conda/lib/python3.10/site-packages/torchvision/io/image.py:13: UserWarning: Failed to load image Python extension: '/opt/conda/lib/python3.10/site-packages/torchvision/image.so: undefined symbol: _ZN3c1017RegisterOperatorsD1Ev'If you don't plan on using image functionality from `torchvision.io`, you can ignore this warning. Otherwise, there might be something wrong with your environment. Did you have `libjpeg` or `libpng` installed before building `torchvision` from source?
  warn(
2024-10-28 15:22:21.126391: E external/local_xla/xla/stream_executor/cuda/cuda_dnn.cc:9261] Unable to register cuDNN factory: Attempting to register factory for plugin cuDNN when one has already been registered
2024-10-28 15:22:21.126494: E external/local_xla/xla/stream_executor/cuda/cuda_fft.cc:607] Unable to register cuFFT factory: Attempting to register factory for plugin cuFFT when one has already been registered
2024-10-28 15:22:21.332900: E external/local_xla/xla/stream_executor/cuda/cuda_blas.cc:1515] Unable to register cuBLAS factory: Attempting to register factory for plugin cuBLAS when one has already been registered
/opt/conda/lib/python3.10/site-packages/transformers/deepspeed.py:24: FutureWarning: transformers.deepspeed module is deprecated and will be removed in a future version. Please import deepspeed modules directly from transformers.integrations
  warnings.warn(
/opt/conda/lib/python3.10/site-packages/transformers/training_args.py:1525: FutureWarning: `evaluation_strategy` is deprecated and will be removed in version 4.46 of 🤗 Transformers. Use `eval_strategy` instead
  warnings.warn(
last_checkpoint=None
Generating train split: 0 examples [00:00, ? examples/s]Generating train split: 898 examples [00:00, 6110.14 examples/s]Generating train split: 2225 examples [00:00, 9637.85 examples/s]Generating train split: 4000 examples [00:00, 12899.94 examples/s]Generating train split: 5828 examples [00:00, 14884.91 examples/s]Generating train split: 7523 examples [00:00, 15595.32 examples/s]Generating train split: 9285 examples [00:00, 16260.22 examples/s]Generating train split: 11058 examples [00:00, 16728.66 examples/s]Generating train split: 12987 examples [00:00, 17463.21 examples/s]Generating train split: 15664 examples [00:01, 17614.10 examples/s]Generating train split: 17488 examples [00:01, 17785.65 examples/s]Generating train split: 19329 examples [00:01, 17959.16 examples/s]Generating train split: 21183 examples [00:01, 18123.64 examples/s]Generating train split: 23018 examples [00:01, 18187.32 examples/s]Generating train split: 24889 examples [00:01, 18338.05 examples/s]Generating train split: 27601 examples [00:01, 18234.38 examples/s]Generating train split: 30329 examples [00:01, 18215.43 examples/s]Generating train split: 33000 examples [00:01, 18044.72 examples/s]Generating train split: 34879 examples [00:02, 18223.20 examples/s]Generating train split: 37557 examples [00:02, 18092.41 examples/s]Generating train split: 39383 examples [00:02, 18130.29 examples/s]Generating train split: 42043 examples [00:02, 17990.14 examples/s]Generating train split: 43985 examples [00:02, 18209.20 examples/s]Generating train split: 46627 examples [00:02, 18001.74 examples/s]Generating train split: 49281 examples [00:02, 17896.12 examples/s]Generating train split: 51952 examples [00:03, 17822.14 examples/s]Generating train split: 54598 examples [00:03, 17763.31 examples/s]Generating train split: 57204 examples [00:03, 17638.45 examples/s]Generating train split: 59000 examples [00:03, 17635.96 examples/s]Generating train split: 60891 examples [00:03, 17946.43 examples/s]Generating train split: 62703 examples [00:03, 17989.09 examples/s]Generating train split: 64521 examples [00:03, 18038.81 examples/s]Generating train split: 67228 examples [00:03, 18040.38 examples/s]Generating train split: 70000 examples [00:04, 18065.80 examples/s]Generating train split: 71836 examples [00:04, 18134.41 examples/s]Generating train split: 74547 examples [00:04, 18110.82 examples/s]Generating train split: 77226 examples [00:04, 18024.54 examples/s]Generating train split: 79988 examples [00:04, 18082.97 examples/s]Generating train split: 81799 examples [00:04, 18086.64 examples/s]Generating train split: 84394 examples [00:04, 17822.59 examples/s]Generating train split: 86197 examples [00:04, 17871.89 examples/s]Generating train split: 88000 examples [00:05, 17866.84 examples/s]Generating train split: 89877 examples [00:05, 18103.63 examples/s]Generating train split: 92512 examples [00:05, 17904.66 examples/s]Generating train split: 92867 examples [00:05, 17531.75 examples/s]
Generating validation split: 0 examples [00:00, ? examples/s]Generating validation split: 1722 examples [00:00, 17097.36 examples/s]
Running tokenizer on train dataset:   0%|          | 0/92867 [00:00<?, ? examples/s]/opt/conda/lib/python3.10/site-packages/transformers/tokenization_utils_base.py:4126: UserWarning: `as_target_tokenizer` is deprecated and will be removed in v5 of Transformers. You can tokenize your labels by using the argument `text_target` of the regular `__call__` method (either in the same call as your input texts if you use the same keyword arguments, or in a separate call.
  warnings.warn(
Running tokenizer on train dataset:   1%|          | 1000/92867 [00:01<02:32, 601.83 examples/s]Running tokenizer on train dataset:   2%|▏         | 2000/92867 [00:02<01:53, 799.00 examples/s]Running tokenizer on train dataset:   3%|▎         | 3000/92867 [00:04<02:07, 702.11 examples/s]Running tokenizer on train dataset:   4%|▍         | 4000/92867 [00:06<02:27, 601.95 examples/s]Running tokenizer on train dataset:   5%|▌         | 5000/92867 [00:08<02:31, 581.00 examples/s]Running tokenizer on train dataset:   6%|▋         | 6000/92867 [00:09<02:33, 566.75 examples/s]Running tokenizer on train dataset:   8%|▊         | 7000/92867 [00:11<02:34, 556.50 examples/s]Running tokenizer on train dataset:   9%|▊         | 8000/92867 [00:13<02:34, 550.04 examples/s]Running tokenizer on train dataset:  10%|▉         | 9000/92867 [00:15<02:28, 564.78 examples/s]Running tokenizer on train dataset:  11%|█         | 10000/92867 [00:16<02:11, 629.17 examples/s]Running tokenizer on train dataset:  12%|█▏        | 11000/92867 [00:17<02:00, 680.01 examples/s]Running tokenizer on train dataset:  13%|█▎        | 12000/92867 [00:19<01:55, 697.87 examples/s]Running tokenizer on train dataset:  14%|█▍        | 13000/92867 [00:20<01:51, 714.08 examples/s]Running tokenizer on train dataset:  15%|█▌        | 14000/92867 [00:21<01:43, 762.51 examples/s]Running tokenizer on train dataset:  16%|█▌        | 15000/92867 [00:22<01:39, 783.31 examples/s]Running tokenizer on train dataset:  17%|█▋        | 16000/92867 [00:23<01:35, 806.86 examples/s]Running tokenizer on train dataset:  18%|█▊        | 17000/92867 [00:25<01:32, 820.87 examples/s]Running tokenizer on train dataset:  19%|█▉        | 18000/92867 [00:26<01:31, 820.77 examples/s]Running tokenizer on train dataset:  20%|██        | 19000/92867 [00:27<01:33, 791.95 examples/s]Running tokenizer on train dataset:  22%|██▏       | 20000/92867 [00:28<01:30, 804.26 examples/s]Running tokenizer on train dataset:  23%|██▎       | 21000/92867 [00:29<01:27, 821.53 examples/s]Running tokenizer on train dataset:  24%|██▎       | 22000/92867 [00:31<01:25, 825.39 examples/s]Running tokenizer on train dataset:  25%|██▍       | 23000/92867 [00:32<01:27, 799.29 examples/s]Running tokenizer on train dataset:  26%|██▌       | 24000/92867 [00:33<01:29, 772.25 examples/s]Running tokenizer on train dataset:  27%|██▋       | 25000/92867 [00:35<01:28, 770.51 examples/s]Running tokenizer on train dataset:  28%|██▊       | 26000/92867 [00:36<01:27, 762.65 examples/s]Running tokenizer on train dataset:  29%|██▉       | 27000/92867 [00:37<01:28, 745.81 examples/s]Running tokenizer on train dataset:  30%|███       | 28000/92867 [00:39<01:31, 710.80 examples/s]Running tokenizer on train dataset:  31%|███       | 29000/92867 [00:41<01:31, 699.46 examples/s]Running tokenizer on train dataset:  32%|███▏      | 30000/92867 [00:42<01:30, 692.94 examples/s]Running tokenizer on train dataset:  33%|███▎      | 31000/92867 [00:44<01:31, 673.73 examples/s]Running tokenizer on train dataset:  34%|███▍      | 32000/92867 [00:45<01:34, 642.28 examples/s]Running tokenizer on train dataset:  36%|███▌      | 33000/92867 [00:47<01:33, 642.81 examples/s]Running tokenizer on train dataset:  37%|███▋      | 34000/92867 [00:48<01:32, 633.36 examples/s]Running tokenizer on train dataset:  38%|███▊      | 35000/92867 [00:50<01:31, 629.90 examples/s]Running tokenizer on train dataset:  39%|███▉      | 36000/92867 [00:52<01:31, 621.95 examples/s]Running tokenizer on train dataset:  40%|███▉      | 37000/92867 [00:53<01:28, 631.56 examples/s]Running tokenizer on train dataset:  41%|████      | 38000/92867 [00:55<01:25, 643.47 examples/s]Running tokenizer on train dataset:  42%|████▏     | 39000/92867 [00:56<01:23, 646.27 examples/s]Running tokenizer on train dataset:  43%|████▎     | 40000/92867 [00:58<01:24, 622.24 examples/s]Running tokenizer on train dataset:  44%|████▍     | 41000/92867 [01:00<01:36, 538.24 examples/s]Running tokenizer on train dataset:  45%|████▌     | 42000/92867 [01:02<01:33, 546.13 examples/s]Running tokenizer on train dataset:  46%|████▋     | 43000/92867 [01:04<01:28, 564.59 examples/s]Running tokenizer on train dataset:  47%|████▋     | 44000/92867 [01:05<01:22, 589.55 examples/s]Running tokenizer on train dataset:  48%|████▊     | 45000/92867 [01:07<01:21, 589.89 examples/s]Running tokenizer on train dataset:  50%|████▉     | 46000/92867 [01:09<01:20, 580.46 examples/s]Running tokenizer on train dataset:  51%|█████     | 47000/92867 [01:10<01:16, 596.81 examples/s]Running tokenizer on train dataset:  52%|█████▏    | 48000/92867 [01:12<01:17, 577.11 examples/s]Running tokenizer on train dataset:  53%|█████▎    | 49000/92867 [01:14<01:13, 599.01 examples/s]Running tokenizer on train dataset:  54%|█████▍    | 50000/92867 [01:16<01:15, 564.56 examples/s]Running tokenizer on train dataset:  55%|█████▍    | 51000/92867 [01:18<01:17, 539.92 examples/s]Running tokenizer on train dataset:  56%|█████▌    | 52000/92867 [01:20<01:15, 544.80 examples/s]Running tokenizer on train dataset:  57%|█████▋    | 53000/92867 [01:22<01:14, 532.66 examples/s]Running tokenizer on train dataset:  58%|█████▊    | 54000/92867 [01:23<01:11, 545.89 examples/s]Running tokenizer on train dataset:  59%|█████▉    | 55000/92867 [01:25<01:07, 560.02 examples/s]Running tokenizer on train dataset:  60%|██████    | 56000/92867 [01:27<01:09, 528.99 examples/s]Running tokenizer on train dataset:  61%|██████▏   | 57000/92867 [01:29<01:09, 513.87 examples/s]Running tokenizer on train dataset:  62%|██████▏   | 58000/92867 [01:31<01:08, 506.26 examples/s]Running tokenizer on train dataset:  64%|██████▎   | 59000/92867 [01:33<01:07, 502.80 examples/s]Running tokenizer on train dataset:  65%|██████▍   | 60000/92867 [01:35<00:58, 564.08 examples/s]Running tokenizer on train dataset:  66%|██████▌   | 61000/92867 [01:36<00:52, 605.66 examples/s]Running tokenizer on train dataset:  67%|██████▋   | 62000/92867 [01:37<00:49, 627.92 examples/s]Running tokenizer on train dataset:  68%|██████▊   | 63000/92867 [01:39<00:44, 665.65 examples/s]Running tokenizer on train dataset:  69%|██████▉   | 64000/92867 [01:40<00:41, 701.61 examples/s]Running tokenizer on train dataset:  70%|██████▉   | 65000/92867 [01:41<00:39, 713.10 examples/s]Running tokenizer on train dataset:  71%|███████   | 66000/92867 [01:43<00:37, 720.17 examples/s]Running tokenizer on train dataset:  72%|███████▏  | 67000/92867 [01:44<00:36, 714.77 examples/s]Running tokenizer on train dataset:  73%|███████▎  | 68000/92867 [01:45<00:34, 720.30 examples/s]Running tokenizer on train dataset:  74%|███████▍  | 69000/92867 [01:47<00:32, 728.11 examples/s]Running tokenizer on train dataset:  75%|███████▌  | 70000/92867 [01:48<00:32, 708.42 examples/s]Running tokenizer on train dataset:  76%|███████▋  | 71000/92867 [01:50<00:31, 702.07 examples/s]Running tokenizer on train dataset:  78%|███████▊  | 72000/92867 [01:51<00:30, 693.11 examples/s]Running tokenizer on train dataset:  79%|███████▊  | 73000/92867 [01:53<00:29, 666.73 examples/s]Running tokenizer on train dataset:  80%|███████▉  | 74000/92867 [01:55<00:29, 647.38 examples/s]Running tokenizer on train dataset:  81%|████████  | 75000/92867 [01:56<00:27, 638.56 examples/s]Running tokenizer on train dataset:  82%|████████▏ | 76000/92867 [01:58<00:27, 610.40 examples/s]Running tokenizer on train dataset:  83%|████████▎ | 77000/92867 [02:00<00:26, 602.23 examples/s]Running tokenizer on train dataset:  84%|████████▍ | 78000/92867 [02:01<00:25, 588.00 examples/s]Running tokenizer on train dataset:  85%|████████▌ | 79000/92867 [02:03<00:23, 580.59 examples/s]Running tokenizer on train dataset:  86%|████████▌ | 80000/92867 [02:05<00:22, 581.62 examples/s]Running tokenizer on train dataset:  87%|████████▋ | 81000/92867 [02:07<00:20, 591.51 examples/s]Running tokenizer on train dataset:  88%|████████▊ | 82000/92867 [02:08<00:17, 607.16 examples/s]Running tokenizer on train dataset:  89%|████████▉ | 83000/92867 [02:11<00:18, 522.87 examples/s]Running tokenizer on train dataset:  90%|█████████ | 84000/92867 [02:13<00:17, 510.63 examples/s]Running tokenizer on train dataset:  92%|█████████▏| 85000/92867 [02:14<00:14, 533.85 examples/s]Running tokenizer on train dataset:  93%|█████████▎| 86000/92867 [02:16<00:12, 553.31 examples/s]Running tokenizer on train dataset:  94%|█████████▎| 87000/92867 [02:18<00:10, 550.57 examples/s]Running tokenizer on train dataset:  95%|█████████▍| 88000/92867 [02:20<00:08, 559.95 examples/s]Running tokenizer on train dataset:  96%|█████████▌| 89000/92867 [02:21<00:06, 553.74 examples/s]Running tokenizer on train dataset:  97%|█████████▋| 90000/92867 [02:23<00:05, 561.42 examples/s]Running tokenizer on train dataset:  98%|█████████▊| 91000/92867 [02:25<00:03, 519.96 examples/s]Running tokenizer on train dataset:  99%|█████████▉| 92000/92867 [02:27<00:01, 514.55 examples/s]Running tokenizer on train dataset: 100%|██████████| 92867/92867 [02:29<00:00, 505.92 examples/s]Running tokenizer on train dataset: 100%|██████████| 92867/92867 [02:29<00:00, 620.33 examples/s]
Saving cached train data ...
Saving the dataset (0/1 shards):   0%|          | 0/92867 [00:00<?, ? examples/s]Saving the dataset (0/1 shards): 100%|██████████| 92867/92867 [00:00<00:00, 913700.69 examples/s]Saving the dataset (1/1 shards): 100%|██████████| 92867/92867 [00:00<00:00, 913700.69 examples/s]Saving the dataset (1/1 shards): 100%|██████████| 92867/92867 [00:00<00:00, 909559.36 examples/s]
Running tokenizer on validation dataset:   0%|          | 0/1722 [00:00<?, ? examples/s]Running tokenizer on validation dataset:  58%|█████▊    | 1000/1722 [00:01<00:01, 555.53 examples/s]Running tokenizer on validation dataset: 100%|██████████| 1722/1722 [00:03<00:00, 537.31 examples/s]Running tokenizer on validation dataset: 100%|██████████| 1722/1722 [00:03<00:00, 539.63 examples/s]
Saving cached validation data ...
Saving the dataset (0/1 shards):   0%|          | 0/1722 [00:00<?, ? examples/s]Saving the dataset (1/1 shards): 100%|██████████| 1722/1722 [00:00<00:00, 316585.93 examples/s]Saving the dataset (1/1 shards): 100%|██████████| 1722/1722 [00:00<00:00, 306600.65 examples/s]
training_args.use_lang_prefix=True
Downloading builder script:   0%|          | 0.00/8.15k [00:00<?, ?B/s]Downloading builder script: 100%|██████████| 8.15k/8.15k [00:00<00:00, 20.6MB/s]
[WARNING|trainer.py:2764] 2024-10-28 15:25:16,687 >> There were missing keys in the checkpoint model loaded: ['model.encoder.embed_tokens.weight', 'model.decoder.embed_tokens.weight', 'lm_head.weight'].
/opt/conda/lib/python3.10/site-packages/transformers/optimization.py:591: FutureWarning: This implementation of AdamW is deprecated and will be removed in a future version. Use the PyTorch implementation torch.optim.AdamW instead, or set `no_deprecation_warning=True` to disable this warning
  warnings.warn(
All 61904 steps, warm_up steps: 200
/opt/conda/lib/python3.10/site-packages/transformers/trainer.py:3108: FutureWarning: You are using `torch.load` with `weights_only=False` (the current default value), which uses the default pickle module implicitly. It is possible to construct malicious pickle data which will execute arbitrary code during unpickling (See https://github.com/pytorch/pytorch/blob/main/SECURITY.md#untrusted-models for more details). In a future release, the default value for `weights_only` will be flipped to `True`. This limits the functions that could be executed during unpickling. Arbitrary objects will no longer be allowed to be loaded via this mode unless they are explicitly allowlisted by the user via `torch.serialization.add_safe_globals`. We recommend you start setting `weights_only=True` for any use case where you don't have full control of the loaded file. Please open an issue on GitHub for any issues related to this experimental feature.
  torch.load(os.path.join(checkpoint, OPTIMIZER_NAME), map_location=map_location)
wandb: WARNING The `run_name` is currently set to the same value as `TrainingArguments.output_dir`. If this was not intended, please specify a different run name by setting the `TrainingArguments.run_name` parameter.
wandb: Currently logged in as: abdiharyadi. Use `wandb login --relogin` to force relogin
wandb: wandb version 0.18.5 is available!  To upgrade, please run:
wandb:  $ pip install wandb --upgrade
wandb: Tracking run with wandb version 0.17.5
wandb: Run data is saved locally in /kaggle/tmp/amr-tst-indo/AMRBART-id/fine-tune/wandb/run-20241028_152523-2rzpheht
wandb: Run `wandb offline` to turn off syncing.
wandb: Syncing run /kaggle/tmp/amr-tst-indo/AMRBART-id/fine-tune/../outputs/mbart-en-id-smaller-fted
wandb: ⭐️ View project at https://wandb.ai/abdiharyadi/amr-tst
wandb: 🚀 View run at https://wandb.ai/abdiharyadi/amr-tst/runs/2rzpheht
  0%|          | 0/61904 [00:00<?, ?it/s]/opt/conda/lib/python3.10/multiprocessing/popen_fork.py:66: RuntimeWarning: os.fork() was called. os.fork() is incompatible with multithreaded code, and JAX is multithreaded, so this will likely lead to a deadlock.
  self.pid = os.fork()
/opt/conda/lib/python3.10/site-packages/transformers/trainer.py:2843: FutureWarning: You are using `torch.load` with `weights_only=False` (the current default value), which uses the default pickle module implicitly. It is possible to construct malicious pickle data which will execute arbitrary code during unpickling (See https://github.com/pytorch/pytorch/blob/main/SECURITY.md#untrusted-models for more details). In a future release, the default value for `weights_only` will be flipped to `True`. This limits the functions that could be executed during unpickling. Arbitrary objects will no longer be allowed to be loaded via this mode unless they are explicitly allowlisted by the user via `torch.serialization.add_safe_globals`. We recommend you start setting `weights_only=True` for any use case where you don't have full control of the loaded file. Please open an issue on GitHub for any issues related to this experimental feature.
  checkpoint_rng_state = torch.load(rng_file)
 69%|██████▉   | 42563/61904 [00:02<00:01, 15111.16it/s] 69%|██████▉   | 42571/61904 [00:15<00:01, 15111.16it/s] 69%|██████▉   | 42572/61904 [00:15<00:09, 2037.43it/s]  69%|██████▉   | 42573/61904 [00:16<00:10, 1794.87it/s]                                                       {'loss': 2.4441, 'learning_rate': 1.3131725657980034e-07, 'epoch': 11.01}
 69%|██████▉   | 42580/61904 [00:27<00:10, 1794.87it/s] 69%|██████▉   | 42585/61904 [00:35<00:10, 1794.87it/s] 69%|██████▉   | 42586/61904 [00:35<00:35, 542.13it/s]  69%|██████▉   | 42587/61904 [00:37<00:38, 506.46it/s]                                                      {'loss': 2.5027, 'learning_rate': 1.31284843770258e-07, 'epoch': 11.01}
 69%|██████▉   | 42600/61904 [00:54<00:38, 506.46it/s] 69%|██████▉   | 42600/61904 [00:55<00:38, 506.46it/s] 69%|██████▉   | 42601/61904 [00:56<01:29, 214.84it/s] 69%|██████▉   | 42602/61904 [00:57<01:35, 202.87it/s] 69%|██████▉   | 42614/61904 [01:15<01:35, 202.87it/s] 69%|██████▉   | 42615/61904 [01:15<03:13, 99.79it/s]  69%|██████▉   | 42616/61904 [01:16<03:22, 95.09it/s]                                                     {'loss': 2.4709, 'learning_rate': 1.3125243096071566e-07, 'epoch': 11.02}
 69%|██████▉   | 42620/61904 [01:22<03:22, 95.09it/s] 69%|██████▉   | 42628/61904 [01:35<03:22, 95.09it/s] 69%|██████▉   | 42629/61904 [01:35<06:44, 47.68it/s] 69%|██████▉   | 42630/61904 [01:36<07:05, 45.29it/s]                                                     {'loss': 2.4576, 'learning_rate': 1.3122001815117335e-07, 'epoch': 11.02}
 69%|██████▉   | 42640/61904 [01:50<07:05, 45.29it/s] 69%|██████▉   | 42643/61904 [01:55<07:05, 45.29it/s] 69%|██████▉   | 42644/61904 [01:56<14:13, 22.55it/s] 69%|██████▉   | 42645/61904 [01:57<14:58, 21.43it/s] 69%|██████▉   | 42657/61904 [02:15<14:58, 21.43it/s] 69%|██████▉   | 42658/61904 [02:16<28:03, 11.43it/s] 69%|██████▉   | 42659/61904 [02:17<29:30, 10.87it/s]                                                     {'loss': 2.4395, 'learning_rate': 1.31187605341631e-07, 'epoch': 11.03}
 69%|██████▉   | 42660/61904 [02:19<29:30, 10.87it/s] 69%|██████▉   | 42671/61904 [02:35<29:29, 10.87it/s] 69%|██████▉   | 42672/61904 [02:36<53:29,  5.99it/s] 69%|██████▉   | 42673/61904 [02:37<55:56,  5.73it/s]                                                     {'loss': 2.504, 'learning_rate': 1.3115519253208867e-07, 'epoch': 11.03}
 69%|██████▉   | 42680/61904 [02:47<55:55,  5.73it/s] 69%|██████▉   | 42685/61904 [02:55<55:54,  5.73it/s] 69%|██████▉   | 42686/61904 [02:56<1:37:42,  3.28it/s] 69%|██████▉   | 42687/61904 [02:57<1:41:20,  3.16it/s] 69%|██████▉   | 42699/61904 [03:15<1:41:16,  3.16it/s] 69%|██████▉   | 42700/61904 [03:15<2:39:04,  2.01it/s]                                                       {'loss': 2.5521, 'learning_rate': 1.3112277972254634e-07, 'epoch': 11.04}
 69%|██████▉   | 42700/61904 [03:15<2:39:04,  2.01it/s] 69%|██████▉   | 42701/61904 [03:16<2:44:42,  1.94it/s] 69%|██████▉   | 42713/61904 [03:35<2:44:36,  1.94it/s] 69%|██████▉   | 42714/61904 [03:35<4:03:26,  1.31it/s] 69%|██████▉   | 42715/61904 [03:37<4:09:00,  1.28it/s]                                                       {'loss': 2.5074, 'learning_rate': 1.31090366913004e-07, 'epoch': 11.04}
 69%|██████▉   | 42720/61904 [03:44<4:08:56,  1.28it/s] 69%|██████▉   | 42725/61904 [03:51<5:03:16,  1.05it/s] 69%|██████▉   | 42726/61904 [03:52<5:08:56,  1.03it/s] 69%|██████▉   | 42733/61904 [04:02<5:44:09,  1.08s/it] 69%|██████▉   | 42738/61904 [04:08<5:59:06,  1.12s/it]                                                       {'loss': 2.5079, 'learning_rate': 1.3105795410346169e-07, 'epoch': 11.05}
 69%|██████▉   | 42740/61904 [04:11<5:59:04,  1.12s/it] 69%|██████▉   | 42742/61904 [04:14<6:14:27,  1.17s/it] 69%|██████▉   | 42745/61904 [04:18<6:26:10,  1.21s/it] 69%|██████▉   | 42747/61904 [04:20<6:29:18,  1.22s/it] 69%|██████▉   | 42749/61904 [04:23<6:40:38,  1.25s/it] 69%|██████▉   | 42750/61904 [04:24<6:43:45,  1.26s/it] 69%|██████▉   | 42751/61904 [04:26<6:58:22,  1.31s/it] 69%|██████▉   | 42752/61904 [04:27<7:01:38,  1.32s/it] 69%|██████▉   | 42753/61904 [04:29<7:02:38,  1.32s/it] 69%|██████▉   | 42754/61904 [04:30<7:07:03,  1.34s/it] 69%|██████▉   | 42755/61904 [04:32<7:10:05,  1.35s/it] 69%|██████▉   | 42756/61904 [04:33<7:18:24,  1.37s/it] 69%|██████▉   | 42757/61904 [04:34<7:20:48,  1.38s/it] 69%|██████▉   | 42758/61904 [04:36<7:12:12,  1.35s/it] 69%|██████▉   | 42759/61904 [04:37<7:17:53,  1.37s/it] 69%|██████▉   | 42760/61904 [04:38<7:06:44,  1.34s/it]                                                       {'loss': 2.5337, 'learning_rate': 1.3102554129391935e-07, 'epoch': 11.05}
 69%|██████▉   | 42760/61904 [04:38<7:06:44,  1.34s/it] 69%|██████▉   | 42761/61904 [04:40<7:09:44,  1.35s/it] 69%|██████▉   | 42762/61904 [04:41<7:11:36,  1.35s/it] 69%|██████▉   | 42763/61904 [04:43<7:29:58,  1.41s/it] 69%|██████▉   | 42764/61904 [04:44<7:15:09,  1.36s/it] 69%|██████▉   | 42765/61904 [04:45<7:11:15,  1.35s/it] 69%|██████▉   | 42766/61904 [04:47<7:24:03,  1.39s/it] 69%|██████▉   | 42767/61904 [04:48<7:23:49,  1.39s/it] 69%|██████▉   | 42768/61904 [04:49<7:15:42,  1.37s/it] 69%|██████▉   | 42769/61904 [04:51<7:05:52,  1.34s/it] 69%|██████▉   | 42770/61904 [04:52<7:12:41,  1.36s/it] 69%|██████▉   | 42771/61904 [04:53<7:09:17,  1.35s/it] 69%|██████▉   | 42772/61904 [04:55<7:34:28,  1.43s/it] 69%|██████▉   | 42773/61904 [04:56<7:27:30,  1.40s/it] 69%|██████▉   | 42774/61904 [04:58<7:23:01,  1.39s/it] 69%|██████▉   | 42775/61904 [04:59<7:42:35,  1.45s/it] 69%|██████▉   | 42776/61904 [05:01<7:35:08,  1.43s/it] 69%|██████▉   | 42777/61904 [05:02<7:20:15,  1.38s/it] 69%|██████▉   | 42778/61904 [05:03<7:27:29,  1.40s/it] 69%|██████▉   | 42779/61904 [05:05<7:28:05,  1.41s/it] 69%|██████▉   | 42780/61904 [05:06<7:18:40,  1.38s/it]                                                       {'loss': 2.4815, 'learning_rate': 1.30993128484377e-07, 'epoch': 11.06}
 69%|██████▉   | 42780/61904 [05:06<7:18:40,  1.38s/it] 69%|██████▉   | 42781/61904 [05:07<7:07:01,  1.34s/it] 69%|██████▉   | 42782/61904 [05:09<7:26:11,  1.40s/it] 69%|██████▉   | 42783/61904 [05:10<7:42:01,  1.45s/it] 69%|██████▉   | 42784/61904 [05:12<7:37:45,  1.44s/it] 69%|██████▉   | 42785/61904 [05:13<7:32:04,  1.42s/it] 69%|██████▉   | 42786/61904 [05:15<7:32:45,  1.42s/it] 69%|██████▉   | 42787/61904 [05:16<7:21:50,  1.39s/it] 69%|██████▉   | 42788/61904 [05:17<7:17:17,  1.37s/it] 69%|██████▉   | 42789/61904 [05:19<7:18:34,  1.38s/it] 69%|██████▉   | 42790/61904 [05:20<7:14:57,  1.37s/it] 69%|██████▉   | 42791/61904 [05:21<7:11:49,  1.36s/it] 69%|██████▉   | 42792/61904 [05:23<7:06:00,  1.34s/it] 69%|██████▉   | 42793/61904 [05:24<6:57:11,  1.31s/it] 69%|██████▉   | 42794/61904 [05:25<7:06:40,  1.34s/it] 69%|██████▉   | 42795/61904 [05:27<7:17:07,  1.37s/it] 69%|██████▉   | 42796/61904 [05:28<7:27:36,  1.41s/it] 69%|██████▉   | 42797/61904 [05:30<7:23:02,  1.39s/it] 69%|██████▉   | 42798/61904 [05:31<7:27:14,  1.40s/it] 69%|██████▉   | 42799/61904 [05:33<7:38:21,  1.44s/it] 69%|██████▉   | 42800/61904 [05:34<7:37:48,  1.44s/it]                                                       {'loss': 2.4897, 'learning_rate': 1.309607156748347e-07, 'epoch': 11.06}
 69%|██████▉   | 42800/61904 [05:34<7:37:48,  1.44s/it] 69%|██████▉   | 42801/61904 [05:35<7:27:45,  1.41s/it] 69%|██████▉   | 42802/61904 [05:37<7:36:56,  1.44s/it] 69%|██████▉   | 42803/61904 [05:38<7:28:51,  1.41s/it] 69%|██████▉   | 42804/61904 [05:40<7:23:58,  1.39s/it] 69%|██████▉   | 42805/61904 [05:41<7:23:22,  1.39s/it] 69%|██████▉   | 42806/61904 [05:42<7:16:54,  1.37s/it] 69%|██████▉   | 42807/61904 [05:44<7:37:10,  1.44s/it] 69%|██████▉   | 42808/61904 [05:45<7:25:29,  1.40s/it] 69%|██████▉   | 42809/61904 [05:47<7:43:01,  1.45s/it] 69%|██████▉   | 42810/61904 [05:48<7:33:33,  1.43s/it] 69%|██████▉   | 42811/61904 [05:49<7:25:22,  1.40s/it] 69%|██████▉   | 42812/61904 [05:51<7:21:32,  1.39s/it] 69%|██████▉   | 42813/61904 [05:52<7:27:17,  1.41s/it] 69%|██████▉   | 42814/61904 [05:54<7:36:48,  1.44s/it] 69%|██████▉   | 42815/61904 [05:55<7:31:09,  1.42s/it] 69%|██████▉   | 42816/61904 [05:57<7:41:34,  1.45s/it] 69%|██████▉   | 42817/61904 [05:58<7:40:51,  1.45s/it] 69%|██████▉   | 42818/61904 [05:59<7:30:10,  1.42s/it] 69%|██████▉   | 42819/61904 [06:01<7:27:44,  1.41s/it] 69%|██████▉   | 42820/61904 [06:02<7:22:23,  1.39s/it]                                                       {'loss': 2.5184, 'learning_rate': 1.3092830286529236e-07, 'epoch': 11.07}
 69%|██████▉   | 42820/61904 [06:02<7:22:23,  1.39s/it] 69%|██████▉   | 42821/61904 [06:04<7:29:51,  1.41s/it] 69%|██████▉   | 42822/61904 [06:05<7:19:46,  1.38s/it] 69%|██████▉   | 42823/61904 [06:06<7:28:08,  1.41s/it] 69%|██████▉   | 42824/61904 [06:08<7:39:20,  1.44s/it] 69%|██████▉   | 42825/61904 [06:10<7:51:07,  1.48s/it] 69%|██████▉   | 42826/61904 [06:11<7:48:03,  1.47s/it] 69%|██████▉   | 42827/61904 [06:12<7:37:19,  1.44s/it] 69%|██████▉   | 42828/61904 [06:14<7:36:45,  1.44s/it] 69%|██████▉   | 42829/61904 [06:15<7:19:32,  1.38s/it] 69%|██████▉   | 42830/61904 [06:16<7:21:24,  1.39s/it] 69%|██████▉   | 42831/61904 [06:18<7:10:16,  1.35s/it] 69%|██████▉   | 42832/61904 [06:19<7:14:20,  1.37s/it] 69%|██████▉   | 42833/61904 [06:21<7:22:32,  1.39s/it] 69%|██████▉   | 42834/61904 [06:22<7:24:07,  1.40s/it] 69%|██████▉   | 42835/61904 [06:23<7:24:44,  1.40s/it] 69%|██████▉   | 42836/61904 [06:25<7:13:17,  1.36s/it] 69%|██████▉   | 42837/61904 [06:26<7:06:43,  1.34s/it] 69%|██████▉   | 42838/61904 [06:27<6:59:31,  1.32s/it] 69%|██████▉   | 42839/61904 [06:29<6:59:32,  1.32s/it] 69%|██████▉   | 42840/61904 [06:30<6:56:26,  1.31s/it]                                                       {'loss': 2.459, 'learning_rate': 1.3089589005575002e-07, 'epoch': 11.07}
 69%|██████▉   | 42840/61904 [06:30<6:56:26,  1.31s/it] 69%|██████▉   | 42841/61904 [06:31<6:59:56,  1.32s/it] 69%|██████▉   | 42842/61904 [06:32<7:00:08,  1.32s/it] 69%|██████▉   | 42843/61904 [06:34<7:16:02,  1.37s/it] 69%|██████▉   | 42844/61904 [06:35<7:22:41,  1.39s/it] 69%|██████▉   | 42845/61904 [06:37<7:12:17,  1.36s/it] 69%|██████▉   | 42846/61904 [06:38<7:16:31,  1.37s/it] 69%|██████▉   | 42847/61904 [06:40<7:23:33,  1.40s/it] 69%|██████▉   | 42848/61904 [06:41<7:15:51,  1.37s/it] 69%|██████▉   | 42849/61904 [06:42<7:10:23,  1.36s/it] 69%|██████▉   | 42850/61904 [06:44<7:18:25,  1.38s/it] 69%|██████▉   | 42851/61904 [06:45<7:14:36,  1.37s/it] 69%|██████▉   | 42852/61904 [06:46<7:23:56,  1.40s/it] 69%|██████▉   | 42853/61904 [06:48<7:28:49,  1.41s/it] 69%|██████▉   | 42854/61904 [06:49<7:15:42,  1.37s/it] 69%|██████▉   | 42855/61904 [06:51<7:16:48,  1.38s/it] 69%|██████▉   | 42856/61904 [06:52<7:10:03,  1.35s/it] 69%|██████▉   | 42857/61904 [06:53<7:26:09,  1.41s/it] 69%|██████▉   | 42858/61904 [06:55<7:18:09,  1.38s/it] 69%|██████▉   | 42859/61904 [06:56<7:20:47,  1.39s/it] 69%|██████▉   | 42860/61904 [06:57<7:15:57,  1.37s/it]                                                       {'loss': 2.4623, 'learning_rate': 1.308634772462077e-07, 'epoch': 11.08}
 69%|██████▉   | 42860/61904 [06:57<7:15:57,  1.37s/it] 69%|██████▉   | 42861/61904 [06:59<7:04:17,  1.34s/it] 69%|██████▉   | 42862/61904 [07:00<7:08:49,  1.35s/it] 69%|██████▉   | 42863/61904 [07:01<7:12:30,  1.36s/it] 69%|██████▉   | 42864/61904 [07:03<7:31:19,  1.42s/it] 69%|██████▉   | 42865/61904 [07:04<7:29:56,  1.42s/it] 69%|██████▉   | 42866/61904 [07:06<7:38:35,  1.45s/it] 69%|██████▉   | 42867/61904 [07:07<7:39:48,  1.45s/it] 69%|██████▉   | 42868/61904 [07:09<7:28:47,  1.41s/it] 69%|██████▉   | 42869/61904 [07:10<7:25:26,  1.40s/it] 69%|██████▉   | 42870/61904 [07:11<7:17:59,  1.38s/it] 69%|██████▉   | 42871/61904 [07:13<7:07:09,  1.35s/it] 69%|██████▉   | 42872/61904 [07:14<7:28:55,  1.42s/it] 69%|██████▉   | 42873/61904 [07:16<7:13:52,  1.37s/it] 69%|██████▉   | 42874/61904 [07:17<7:19:15,  1.38s/it] 69%|██████▉   | 42875/61904 [07:18<7:25:28,  1.40s/it] 69%|██████▉   | 42876/61904 [07:20<7:34:26,  1.43s/it] 69%|██████▉   | 42877/61904 [07:21<7:25:34,  1.41s/it] 69%|██████▉   | 42878/61904 [07:23<7:29:35,  1.42s/it] 69%|██████▉   | 42879/61904 [07:24<7:26:17,  1.41s/it] 69%|██████▉   | 42880/61904 [07:26<7:29:47,  1.42s/it]                                                       {'loss': 2.4422, 'learning_rate': 1.3083106443666535e-07, 'epoch': 11.08}
 69%|██████▉   | 42880/61904 [07:26<7:29:47,  1.42s/it] 69%|██████▉   | 42881/61904 [07:27<7:33:33,  1.43s/it] 69%|██████▉   | 42882/61904 [07:28<7:10:58,  1.36s/it] 69%|██████▉   | 42883/61904 [07:30<7:09:58,  1.36s/it] 69%|██████▉   | 42884/61904 [07:31<7:05:03,  1.34s/it] 69%|██████▉   | 42885/61904 [07:32<7:11:59,  1.36s/it] 69%|██████▉   | 42886/61904 [07:34<7:04:29,  1.34s/it] 69%|██████▉   | 42887/61904 [07:35<7:08:35,  1.35s/it] 69%|██████▉   | 42888/61904 [07:36<7:17:21,  1.38s/it] 69%|██████▉   | 42889/61904 [07:38<7:12:59,  1.37s/it] 69%|██████▉   | 42890/61904 [07:39<7:12:41,  1.37s/it] 69%|██████▉   | 42891/61904 [07:40<7:17:41,  1.38s/it] 69%|██████▉   | 42892/61904 [07:42<7:13:04,  1.37s/it] 69%|██████▉   | 42893/61904 [07:43<7:16:50,  1.38s/it] 69%|██████▉   | 42894/61904 [07:45<7:19:22,  1.39s/it] 69%|██████▉   | 42895/61904 [07:46<7:28:33,  1.42s/it] 69%|██████▉   | 42896/61904 [07:47<7:21:04,  1.39s/it] 69%|██████▉   | 42897/61904 [07:49<7:14:24,  1.37s/it] 69%|██████▉   | 42898/61904 [07:50<7:06:40,  1.35s/it] 69%|██████▉   | 42899/61904 [07:51<7:06:30,  1.35s/it] 69%|██████▉   | 42900/61904 [07:53<7:11:31,  1.36s/it]                                                       {'loss': 2.5212, 'learning_rate': 1.3079865162712303e-07, 'epoch': 11.09}
 69%|██████▉   | 42900/61904 [07:53<7:11:31,  1.36s/it] 69%|██████▉   | 42901/61904 [07:54<7:13:46,  1.37s/it] 69%|██████▉   | 42902/61904 [07:55<7:04:58,  1.34s/it] 69%|██████▉   | 42903/61904 [07:57<7:10:35,  1.36s/it] 69%|██████▉   | 42904/61904 [07:58<7:20:54,  1.39s/it] 69%|██████▉   | 42905/61904 [08:00<7:20:25,  1.39s/it] 69%|██████▉   | 42906/61904 [08:01<7:15:49,  1.38s/it] 69%|██████▉   | 42907/61904 [08:02<7:10:16,  1.36s/it] 69%|██████▉   | 42908/61904 [08:04<7:05:18,  1.34s/it] 69%|██████▉   | 42909/61904 [08:05<7:06:24,  1.35s/it] 69%|██████▉   | 42910/61904 [08:06<7:01:36,  1.33s/it] 69%|██████▉   | 42911/61904 [08:08<7:06:59,  1.35s/it] 69%|██████▉   | 42912/61904 [08:09<7:08:11,  1.35s/it] 69%|██████▉   | 42913/61904 [08:11<7:45:14,  1.47s/it] 69%|██████▉   | 42914/61904 [08:12<7:24:31,  1.40s/it] 69%|██████▉   | 42915/61904 [08:13<7:21:17,  1.39s/it] 69%|██████▉   | 42916/61904 [08:15<7:07:42,  1.35s/it] 69%|██████▉   | 42917/61904 [08:16<7:18:44,  1.39s/it] 69%|██████▉   | 42918/61904 [08:18<7:29:04,  1.42s/it] 69%|██████▉   | 42919/61904 [08:19<7:31:28,  1.43s/it] 69%|██████▉   | 42920/61904 [08:21<7:34:15,  1.44s/it]                                                       {'loss': 2.4923, 'learning_rate': 1.307662388175807e-07, 'epoch': 11.09}
 69%|██████▉   | 42920/61904 [08:21<7:34:15,  1.44s/it] 69%|██████▉   | 42921/61904 [08:22<7:36:44,  1.44s/it] 69%|██████▉   | 42922/61904 [08:23<7:21:47,  1.40s/it] 69%|██████▉   | 42923/61904 [08:25<7:09:44,  1.36s/it] 69%|██████▉   | 42924/61904 [08:26<7:05:19,  1.34s/it] 69%|██████▉   | 42925/61904 [08:27<7:23:00,  1.40s/it] 69%|██████▉   | 42926/61904 [08:29<7:26:12,  1.41s/it] 69%|██████▉   | 42927/61904 [08:30<7:32:45,  1.43s/it] 69%|██████▉   | 42928/61904 [08:32<7:17:30,  1.38s/it] 69%|██████▉   | 42929/61904 [08:33<7:18:52,  1.39s/it] 69%|██████▉   | 42930/61904 [08:35<7:36:21,  1.44s/it] 69%|██████▉   | 42931/61904 [08:36<7:19:33,  1.39s/it] 69%|██████▉   | 42932/61904 [08:37<7:13:42,  1.37s/it] 69%|██████▉   | 42933/61904 [08:39<7:14:51,  1.38s/it] 69%|██████▉   | 42934/61904 [08:40<7:28:35,  1.42s/it] 69%|██████▉   | 42935/61904 [08:41<7:19:30,  1.39s/it] 69%|██████▉   | 42936/61904 [08:43<7:25:27,  1.41s/it] 69%|██████▉   | 42937/61904 [08:44<7:12:21,  1.37s/it] 69%|██████▉   | 42938/61904 [08:45<7:07:38,  1.35s/it] 69%|██████▉   | 42939/61904 [08:47<6:53:51,  1.31s/it] 69%|██████▉   | 42940/61904 [08:48<7:09:33,  1.36s/it]                                                       {'loss': 2.5076, 'learning_rate': 1.3073382600803836e-07, 'epoch': 11.1}
 69%|██████▉   | 42940/61904 [08:48<7:09:33,  1.36s/it] 69%|██████▉   | 42941/61904 [08:49<7:01:10,  1.33s/it] 69%|██████▉   | 42942/61904 [08:51<7:01:12,  1.33s/it] 69%|██████▉   | 42943/61904 [08:52<7:06:33,  1.35s/it] 69%|██████▉   | 42944/61904 [08:53<7:05:59,  1.35s/it] 69%|██████▉   | 42945/61904 [08:55<7:15:41,  1.38s/it] 69%|██████▉   | 42946/61904 [08:56<7:03:36,  1.34s/it] 69%|██████▉   | 42947/61904 [08:57<6:55:23,  1.31s/it] 69%|██████▉   | 42948/61904 [08:59<7:07:49,  1.35s/it] 69%|██████▉   | 42949/61904 [09:00<7:20:19,  1.39s/it] 69%|██████▉   | 42950/61904 [09:02<7:23:08,  1.40s/it] 69%|██████▉   | 42951/61904 [09:03<7:35:31,  1.44s/it] 69%|██████▉   | 42952/61904 [09:05<7:29:29,  1.42s/it] 69%|██████▉   | 42953/61904 [09:06<7:40:01,  1.46s/it] 69%|██████▉   | 42954/61904 [09:08<7:26:35,  1.41s/it] 69%|██████▉   | 42955/61904 [09:09<7:28:54,  1.42s/it] 69%|██████▉   | 42956/61904 [09:10<7:20:19,  1.39s/it] 69%|██████▉   | 42957/61904 [09:12<7:27:27,  1.42s/it] 69%|██████▉   | 42958/61904 [09:13<7:30:01,  1.43s/it] 69%|██████▉   | 42959/61904 [09:15<7:29:30,  1.42s/it] 69%|██████▉   | 42960/61904 [09:16<7:23:46,  1.41s/it]                                                       {'loss': 2.5291, 'learning_rate': 1.3070141319849605e-07, 'epoch': 11.1}
 69%|██████▉   | 42960/61904 [09:16<7:23:46,  1.41s/it] 69%|██████▉   | 42961/61904 [09:17<7:18:46,  1.39s/it] 69%|██████▉   | 42962/61904 [09:19<7:07:19,  1.35s/it] 69%|██████▉   | 42963/61904 [09:20<6:59:50,  1.33s/it] 69%|██████▉   | 42964/61904 [09:21<6:57:35,  1.32s/it] 69%|██████▉   | 42965/61904 [09:22<6:52:36,  1.31s/it] 69%|██████▉   | 42966/61904 [09:24<7:19:34,  1.39s/it] 69%|██████▉   | 42967/61904 [09:26<7:24:34,  1.41s/it] 69%|██████▉   | 42968/61904 [09:27<7:25:12,  1.41s/it] 69%|██████▉   | 42969/61904 [09:28<7:25:55,  1.41s/it] 69%|██████▉   | 42970/61904 [09:30<7:23:50,  1.41s/it] 69%|██████▉   | 42971/61904 [09:31<7:20:55,  1.40s/it] 69%|██████▉   | 42972/61904 [09:32<7:15:14,  1.38s/it] 69%|██████▉   | 42973/61904 [09:34<7:22:58,  1.40s/it] 69%|██████▉   | 42974/61904 [09:35<7:25:41,  1.41s/it] 69%|██████▉   | 42975/61904 [09:37<7:20:33,  1.40s/it] 69%|██████▉   | 42976/61904 [09:38<7:16:05,  1.38s/it] 69%|██████▉   | 42977/61904 [09:39<7:17:07,  1.39s/it] 69%|██████▉   | 42978/61904 [09:41<7:13:15,  1.37s/it] 69%|██████▉   | 42979/61904 [09:42<7:15:25,  1.38s/it] 69%|██████▉   | 42980/61904 [09:44<7:09:50,  1.36s/it]                                                       {'loss': 2.4459, 'learning_rate': 1.306690003889537e-07, 'epoch': 11.11}
 69%|██████▉   | 42980/61904 [09:44<7:09:50,  1.36s/it] 69%|██████▉   | 42981/61904 [09:45<7:20:34,  1.40s/it] 69%|██████▉   | 42982/61904 [09:46<7:13:38,  1.38s/it] 69%|██████▉   | 42983/61904 [09:48<7:15:49,  1.38s/it] 69%|██████▉   | 42984/61904 [09:49<7:08:51,  1.36s/it] 69%|██████▉   | 42985/61904 [09:50<7:04:47,  1.35s/it] 69%|██████▉   | 42986/61904 [09:52<6:59:37,  1.33s/it] 69%|██████▉   | 42987/61904 [09:53<7:05:27,  1.35s/it] 69%|██████▉   | 42988/61904 [09:54<7:08:41,  1.36s/it] 69%|██████▉   | 42989/61904 [09:56<7:01:03,  1.34s/it] 69%|██████▉   | 42990/61904 [09:57<6:58:16,  1.33s/it] 69%|██████▉   | 42991/61904 [09:58<7:01:48,  1.34s/it] 69%|██████▉   | 42992/61904 [10:00<7:08:29,  1.36s/it] 69%|██████▉   | 42993/61904 [10:01<7:06:56,  1.35s/it] 69%|██████▉   | 42994/61904 [10:02<7:00:31,  1.33s/it] 69%|██████▉   | 42995/61904 [10:04<7:13:46,  1.38s/it] 69%|██████▉   | 42996/61904 [10:05<7:15:30,  1.38s/it] 69%|██████▉   | 42997/61904 [10:07<7:16:25,  1.38s/it] 69%|██████▉   | 42998/61904 [10:08<7:08:26,  1.36s/it] 69%|██████▉   | 42999/61904 [10:09<7:01:07,  1.34s/it] 69%|██████▉   | 43000/61904 [10:11<7:01:28,  1.34s/it]                                                       {'loss': 2.4522, 'learning_rate': 1.3063658757941137e-07, 'epoch': 11.11}
 69%|██████▉   | 43000/61904 [10:11<7:01:28,  1.34s/it] 69%|██████▉   | 43001/61904 [10:12<7:10:11,  1.37s/it] 69%|██████▉   | 43002/61904 [10:13<7:08:55,  1.36s/it] 69%|██████▉   | 43003/61904 [10:15<7:03:51,  1.35s/it] 69%|██████▉   | 43004/61904 [10:16<7:03:37,  1.34s/it] 69%|██████▉   | 43005/61904 [10:17<6:57:56,  1.33s/it] 69%|██████▉   | 43006/61904 [10:19<6:48:56,  1.30s/it] 69%|██████▉   | 43007/61904 [10:20<7:06:31,  1.35s/it] 69%|██████▉   | 43008/61904 [10:21<7:09:50,  1.36s/it] 69%|██████▉   | 43009/61904 [10:23<7:11:34,  1.37s/it] 69%|██████▉   | 43010/61904 [10:24<7:20:29,  1.40s/it] 69%|██████▉   | 43011/61904 [10:26<7:16:55,  1.39s/it] 69%|██████▉   | 43012/61904 [10:27<7:14:04,  1.38s/it] 69%|██████▉   | 43013/61904 [10:28<7:02:22,  1.34s/it] 69%|██████▉   | 43014/61904 [10:30<6:58:56,  1.33s/it] 69%|██████▉   | 43015/61904 [10:31<6:53:30,  1.31s/it] 69%|██████▉   | 43016/61904 [10:32<7:07:09,  1.36s/it] 69%|██████▉   | 43017/61904 [10:34<7:10:49,  1.37s/it] 69%|██████▉   | 43018/61904 [10:35<7:08:25,  1.36s/it] 69%|██████▉   | 43019/61904 [10:36<7:15:17,  1.38s/it] 69%|██████▉   | 43020/61904 [10:38<7:09:32,  1.36s/it]                                                       {'loss': 2.4752, 'learning_rate': 1.3060417476986906e-07, 'epoch': 11.12}
 69%|██████▉   | 43020/61904 [10:38<7:09:32,  1.36s/it] 69%|██████▉   | 43021/61904 [10:39<7:08:39,  1.36s/it] 69%|██████▉   | 43022/61904 [10:40<7:06:54,  1.36s/it] 69%|██████▉   | 43023/61904 [10:42<6:58:59,  1.33s/it] 70%|██████▉   | 43024/61904 [10:43<6:56:57,  1.33s/it] 70%|██████▉   | 43025/61904 [10:44<7:02:19,  1.34s/it] 70%|██████▉   | 43026/61904 [10:46<7:13:03,  1.38s/it] 70%|██████▉   | 43027/61904 [10:47<7:13:45,  1.38s/it] 70%|██████▉   | 43028/61904 [10:49<7:17:57,  1.39s/it] 70%|██████▉   | 43029/61904 [10:50<7:25:42,  1.42s/it] 70%|██████▉   | 43030/61904 [10:51<7:14:56,  1.38s/it] 70%|██████▉   | 43031/61904 [10:53<7:24:39,  1.41s/it] 70%|██████▉   | 43032/61904 [10:54<7:20:26,  1.40s/it] 70%|██████▉   | 43033/61904 [10:56<7:16:37,  1.39s/it] 70%|██████▉   | 43034/61904 [10:57<7:29:28,  1.43s/it] 70%|██████▉   | 43035/61904 [10:58<7:09:54,  1.37s/it] 70%|██████▉   | 43036/61904 [11:00<7:21:55,  1.41s/it] 70%|██████▉   | 43037/61904 [11:01<7:20:24,  1.40s/it] 70%|██████▉   | 43038/61904 [11:03<7:14:15,  1.38s/it] 70%|██████▉   | 43039/61904 [11:04<7:18:38,  1.40s/it] 70%|██████▉   | 43040/61904 [11:06<7:27:56,  1.42s/it]                                                       {'loss': 2.4877, 'learning_rate': 1.3057176196032672e-07, 'epoch': 11.12}
 70%|██████▉   | 43040/61904 [11:06<7:27:56,  1.42s/it] 70%|██████▉   | 43041/61904 [11:07<7:36:19,  1.45s/it] 70%|██████▉   | 43042/61904 [11:09<7:32:59,  1.44s/it] 70%|██████▉   | 43043/61904 [11:10<7:37:13,  1.45s/it] 70%|██████▉   | 43044/61904 [11:12<8:08:20,  1.55s/it] 70%|██████▉   | 43045/61904 [11:13<7:59:29,  1.53s/it] 70%|██████▉   | 43046/61904 [11:15<7:55:41,  1.51s/it] 70%|██████▉   | 43047/61904 [11:16<7:43:01,  1.47s/it] 70%|██████▉   | 43048/61904 [11:18<7:41:23,  1.47s/it] 70%|██████▉   | 43049/61904 [11:19<7:30:20,  1.43s/it] 70%|██████▉   | 43050/61904 [11:20<7:21:40,  1.41s/it] 70%|██████▉   | 43051/61904 [11:22<7:40:25,  1.47s/it] 70%|██████▉   | 43052/61904 [11:23<7:37:46,  1.46s/it] 70%|██████▉   | 43053/61904 [11:25<7:30:01,  1.43s/it] 70%|██████▉   | 43054/61904 [11:26<7:25:56,  1.42s/it] 70%|██████▉   | 43055/61904 [11:27<7:08:54,  1.37s/it] 70%|██████▉   | 43056/61904 [11:29<7:05:08,  1.35s/it] 70%|██████▉   | 43057/61904 [11:30<7:01:00,  1.34s/it] 70%|██████▉   | 43058/61904 [11:31<7:05:44,  1.36s/it] 70%|██████▉   | 43059/61904 [11:33<7:07:47,  1.36s/it] 70%|██████▉   | 43060/61904 [11:34<7:07:14,  1.36s/it]                                                       {'loss': 2.4969, 'learning_rate': 1.3053934915078438e-07, 'epoch': 11.13}
 70%|██████▉   | 43060/61904 [11:34<7:07:14,  1.36s/it] 70%|██████▉   | 43061/61904 [11:35<7:07:46,  1.36s/it] 70%|██████▉   | 43062/61904 [11:37<7:13:27,  1.38s/it] 70%|██████▉   | 43063/61904 [11:38<7:07:30,  1.36s/it] 70%|██████▉   | 43064/61904 [11:40<7:15:50,  1.39s/it] 70%|██████▉   | 43065/61904 [11:41<7:19:14,  1.40s/it] 70%|██████▉   | 43066/61904 [11:42<7:09:07,  1.37s/it] 70%|██████▉   | 43067/61904 [11:44<7:15:59,  1.39s/it] 70%|██████▉   | 43068/61904 [11:45<7:23:51,  1.41s/it] 70%|██████▉   | 43069/61904 [11:47<7:13:26,  1.38s/it] 70%|██████▉   | 43070/61904 [11:48<7:11:12,  1.37s/it] 70%|██████▉   | 43071/61904 [11:49<7:07:01,  1.36s/it] 70%|██████▉   | 43072/61904 [11:51<6:59:04,  1.34s/it] 70%|██████▉   | 43073/61904 [11:52<6:49:12,  1.30s/it] 70%|██████▉   | 43074/61904 [11:53<7:09:57,  1.37s/it] 70%|██████▉   | 43075/61904 [11:55<7:07:35,  1.36s/it] 70%|██████▉   | 43076/61904 [11:56<7:01:15,  1.34s/it] 70%|██████▉   | 43077/61904 [11:57<6:53:09,  1.32s/it] 70%|██████▉   | 43078/61904 [11:59<6:58:05,  1.33s/it] 70%|██████▉   | 43079/61904 [12:00<6:58:37,  1.33s/it] 70%|██████▉   | 43080/61904 [12:01<7:05:28,  1.36s/it]                                                       {'loss': 2.5331, 'learning_rate': 1.3050693634124207e-07, 'epoch': 11.13}
 70%|██████▉   | 43080/61904 [12:01<7:05:28,  1.36s/it] 70%|██████▉   | 43081/61904 [12:03<7:14:08,  1.38s/it] 70%|██████▉   | 43082/61904 [12:04<7:08:41,  1.37s/it] 70%|██████▉   | 43083/61904 [12:05<7:01:39,  1.34s/it] 70%|██████▉   | 43084/61904 [12:07<6:56:09,  1.33s/it] 70%|██████▉   | 43085/61904 [12:08<7:13:19,  1.38s/it] 70%|██████▉   | 43086/61904 [12:10<7:12:25,  1.38s/it] 70%|██████▉   | 43087/61904 [12:11<7:13:18,  1.38s/it] 70%|██████▉   | 43088/61904 [12:12<7:21:37,  1.41s/it] 70%|██████▉   | 43089/61904 [12:14<7:24:11,  1.42s/it] 70%|██████▉   | 43090/61904 [12:15<7:20:14,  1.40s/it] 70%|██████▉   | 43091/61904 [12:16<7:08:32,  1.37s/it] 70%|██████▉   | 43092/61904 [12:18<7:31:30,  1.44s/it] 70%|██████▉   | 43093/61904 [12:19<7:24:51,  1.42s/it] 70%|██████▉   | 43094/61904 [12:21<7:30:33,  1.44s/it] 70%|██████▉   | 43095/61904 [12:22<7:28:07,  1.43s/it] 70%|██████▉   | 43096/61904 [12:24<7:19:34,  1.40s/it] 70%|██████▉   | 43097/61904 [12:25<7:31:08,  1.44s/it] 70%|██████▉   | 43098/61904 [12:27<7:20:00,  1.40s/it] 70%|██████▉   | 43099/61904 [12:28<7:11:13,  1.38s/it] 70%|██████▉   | 43100/61904 [12:29<7:12:58,  1.38s/it]                                                       {'loss': 2.4214, 'learning_rate': 1.304745235316997e-07, 'epoch': 11.14}
 70%|██████▉   | 43100/61904 [12:29<7:12:58,  1.38s/it] 70%|██████▉   | 43101/61904 [12:31<7:14:48,  1.39s/it] 70%|██████▉   | 43102/61904 [12:32<7:09:54,  1.37s/it] 70%|██████▉   | 43103/61904 [12:33<7:12:12,  1.38s/it] 70%|██████▉   | 43104/61904 [12:35<7:22:28,  1.41s/it] 70%|██████▉   | 43105/61904 [12:36<7:18:50,  1.40s/it] 70%|██████▉   | 43106/61904 [12:38<7:25:17,  1.42s/it] 70%|██████▉   | 43107/61904 [12:39<7:13:04,  1.38s/it] 70%|██████▉   | 43108/61904 [12:40<7:22:18,  1.41s/it] 70%|██████▉   | 43109/61904 [12:42<7:14:52,  1.39s/it] 70%|██████▉   | 43110/61904 [12:43<7:04:27,  1.36s/it] 70%|██████▉   | 43111/61904 [12:44<7:04:05,  1.35s/it] 70%|██████▉   | 43112/61904 [12:46<7:11:15,  1.38s/it] 70%|██████▉   | 43113/61904 [12:47<7:08:15,  1.37s/it] 70%|██████▉   | 43114/61904 [12:49<7:04:54,  1.36s/it] 70%|██████▉   | 43115/61904 [12:50<7:04:57,  1.36s/it] 70%|██████▉   | 43116/61904 [12:51<7:03:05,  1.35s/it] 70%|██████▉   | 43117/61904 [12:53<7:07:49,  1.37s/it] 70%|██████▉   | 43118/61904 [12:54<7:10:45,  1.38s/it] 70%|██████▉   | 43119/61904 [12:55<7:01:49,  1.35s/it] 70%|██████▉   | 43120/61904 [12:57<7:01:06,  1.35s/it]                                                       {'loss': 2.4795, 'learning_rate': 1.304421107221574e-07, 'epoch': 11.14}
 70%|██████▉   | 43120/61904 [12:57<7:01:06,  1.35s/it] 70%|██████▉   | 43121/61904 [12:58<7:02:44,  1.35s/it] 70%|██████▉   | 43122/61904 [12:59<7:07:37,  1.37s/it] 70%|██████▉   | 43123/61904 [13:01<7:04:28,  1.36s/it] 70%|██████▉   | 43124/61904 [13:02<7:05:22,  1.36s/it] 70%|██████▉   | 43125/61904 [13:04<7:17:04,  1.40s/it] 70%|██████▉   | 43126/61904 [13:05<7:29:57,  1.44s/it] 70%|██████▉   | 43127/61904 [13:06<7:21:09,  1.41s/it] 70%|██████▉   | 43128/61904 [13:08<7:22:04,  1.41s/it] 70%|██████▉   | 43129/61904 [13:09<7:28:13,  1.43s/it] 70%|██████▉   | 43130/61904 [13:11<7:25:18,  1.42s/it] 70%|██████▉   | 43131/61904 [13:12<7:30:33,  1.44s/it] 70%|██████▉   | 43132/61904 [13:14<7:23:44,  1.42s/it] 70%|██████▉   | 43133/61904 [13:15<7:26:35,  1.43s/it] 70%|██████▉   | 43134/61904 [13:17<7:38:56,  1.47s/it] 70%|██████▉   | 43135/61904 [13:18<7:22:25,  1.41s/it] 70%|██████▉   | 43136/61904 [13:19<7:20:51,  1.41s/it] 70%|██████▉   | 43137/61904 [13:21<7:21:26,  1.41s/it] 70%|██████▉   | 43138/61904 [13:22<7:23:50,  1.42s/it] 70%|██████▉   | 43139/61904 [13:24<7:23:26,  1.42s/it] 70%|██████▉   | 43140/61904 [13:25<7:20:52,  1.41s/it]                                                       {'loss': 2.491, 'learning_rate': 1.3040969791261506e-07, 'epoch': 11.15}
 70%|██████▉   | 43140/61904 [13:25<7:20:52,  1.41s/it] 70%|██████▉   | 43141/61904 [13:26<7:11:41,  1.38s/it] 70%|██████▉   | 43142/61904 [13:28<7:05:37,  1.36s/it] 70%|██████▉   | 43143/61904 [13:29<7:10:58,  1.38s/it] 70%|██████▉   | 43144/61904 [13:31<7:22:13,  1.41s/it] 70%|██████▉   | 43145/61904 [13:32<7:11:15,  1.38s/it] 70%|██████▉   | 43146/61904 [13:33<7:18:56,  1.40s/it] 70%|██████▉   | 43147/61904 [13:35<7:16:11,  1.40s/it] 70%|██████▉   | 43148/61904 [13:36<7:14:37,  1.39s/it] 70%|██████▉   | 43149/61904 [13:37<7:03:16,  1.35s/it] 70%|██████▉   | 43150/61904 [13:39<7:00:43,  1.35s/it] 70%|██████▉   | 43151/61904 [13:40<7:02:14,  1.35s/it] 70%|██████▉   | 43152/61904 [13:41<7:02:33,  1.35s/it] 70%|██████▉   | 43153/61904 [13:43<7:02:24,  1.35s/it] 70%|██████▉   | 43154/61904 [13:44<6:58:08,  1.34s/it] 70%|██████▉   | 43155/61904 [13:45<6:59:18,  1.34s/it] 70%|██████▉   | 43156/61904 [13:47<6:49:51,  1.31s/it] 70%|██████▉   | 43157/61904 [13:48<6:50:30,  1.31s/it] 70%|██████▉   | 43158/61904 [13:49<6:57:26,  1.34s/it] 70%|██████▉   | 43159/61904 [13:51<7:00:49,  1.35s/it] 70%|██████▉   | 43160/61904 [13:52<7:12:29,  1.38s/it]                                                       {'loss': 2.4823, 'learning_rate': 1.3037728510307272e-07, 'epoch': 11.16}
 70%|██████▉   | 43160/61904 [13:52<7:12:29,  1.38s/it] 70%|██████▉   | 43161/61904 [13:54<7:51:00,  1.51s/it] 70%|██████▉   | 43162/61904 [13:55<7:40:42,  1.47s/it] 70%|██████▉   | 43163/61904 [13:57<7:33:06,  1.45s/it] 70%|██████▉   | 43164/61904 [13:58<7:40:06,  1.47s/it] 70%|██████▉   | 43165/61904 [14:00<7:35:53,  1.46s/it] 70%|██████▉   | 43166/61904 [14:01<7:21:42,  1.41s/it] 70%|██████▉   | 43167/61904 [14:02<7:15:39,  1.40s/it] 70%|██████▉   | 43168/61904 [14:04<7:26:35,  1.43s/it] 70%|██████▉   | 43169/61904 [14:05<7:16:23,  1.40s/it] 70%|██████▉   | 43170/61904 [14:07<7:08:38,  1.37s/it] 70%|██████▉   | 43171/61904 [14:08<7:02:03,  1.35s/it] 70%|██████▉   | 43172/61904 [14:09<7:13:01,  1.39s/it] 70%|██████▉   | 43173/61904 [14:11<7:11:35,  1.38s/it] 70%|██████▉   | 43174/61904 [14:12<7:05:26,  1.36s/it] 70%|██████▉   | 43175/61904 [14:13<7:13:05,  1.39s/it] 70%|██████▉   | 43176/61904 [14:15<7:23:17,  1.42s/it] 70%|██████▉   | 43177/61904 [14:16<7:20:56,  1.41s/it] 70%|██████▉   | 43178/61904 [14:18<7:19:08,  1.41s/it] 70%|██████▉   | 43179/61904 [14:19<7:14:36,  1.39s/it] 70%|██████▉   | 43180/61904 [14:20<7:08:11,  1.37s/it]                                                       {'loss': 2.5129, 'learning_rate': 1.303448722935304e-07, 'epoch': 11.16}
 70%|██████▉   | 43180/61904 [14:20<7:08:11,  1.37s/it] 70%|██████▉   | 43181/61904 [14:22<7:30:53,  1.44s/it] 70%|██████▉   | 43182/61904 [14:23<7:31:40,  1.45s/it] 70%|██████▉   | 43183/61904 [14:25<7:24:08,  1.42s/it] 70%|██████▉   | 43184/61904 [14:26<7:16:23,  1.40s/it] 70%|██████▉   | 43185/61904 [14:28<7:11:09,  1.38s/it] 70%|██████▉   | 43186/61904 [14:29<7:10:05,  1.38s/it] 70%|██████▉   | 43187/61904 [14:30<7:17:41,  1.40s/it] 70%|██████▉   | 43188/61904 [14:32<7:13:24,  1.39s/it] 70%|██████▉   | 43189/61904 [14:33<7:11:32,  1.38s/it] 70%|██████▉   | 43190/61904 [14:34<7:08:52,  1.38s/it] 70%|██████▉   | 43191/61904 [14:36<7:01:22,  1.35s/it] 70%|██████▉   | 43192/61904 [14:37<6:54:31,  1.33s/it] 70%|██████▉   | 43193/61904 [14:38<7:05:11,  1.36s/it] 70%|██████▉   | 43194/61904 [14:40<7:13:26,  1.39s/it] 70%|██████▉   | 43195/61904 [14:41<7:20:16,  1.41s/it] 70%|██████▉   | 43196/61904 [14:43<7:15:49,  1.40s/it] 70%|██████▉   | 43197/61904 [14:44<7:17:40,  1.40s/it] 70%|██████▉   | 43198/61904 [14:46<7:16:57,  1.40s/it] 70%|██████▉   | 43199/61904 [14:47<7:21:19,  1.42s/it] 70%|██████▉   | 43200/61904 [14:48<7:22:21,  1.42s/it]                                                       {'loss': 2.4543, 'learning_rate': 1.3031245948398807e-07, 'epoch': 11.17}
 70%|██████▉   | 43200/61904 [14:48<7:22:21,  1.42s/it] 70%|██████▉   | 43201/61904 [14:50<7:21:04,  1.42s/it] 70%|██████▉   | 43202/61904 [14:51<7:09:08,  1.38s/it] 70%|██████▉   | 43203/61904 [14:53<7:13:25,  1.39s/it] 70%|██████▉   | 43204/61904 [14:54<7:11:12,  1.38s/it] 70%|██████▉   | 43205/61904 [14:55<7:03:48,  1.36s/it] 70%|██████▉   | 43206/61904 [14:57<7:05:55,  1.37s/it] 70%|██████▉   | 43207/61904 [14:58<7:21:08,  1.42s/it] 70%|██████▉   | 43208/61904 [14:59<7:10:38,  1.38s/it] 70%|██████▉   | 43209/61904 [15:01<7:10:07,  1.38s/it] 70%|██████▉   | 43210/61904 [15:02<7:07:10,  1.37s/it] 70%|██████▉   | 43211/61904 [15:03<7:01:09,  1.35s/it] 70%|██████▉   | 43212/61904 [15:05<7:08:30,  1.38s/it] 70%|██████▉   | 43213/61904 [15:06<7:09:24,  1.38s/it] 70%|██████▉   | 43214/61904 [15:08<7:04:27,  1.36s/it] 70%|██████▉   | 43215/61904 [15:09<7:14:55,  1.40s/it] 70%|██████▉   | 43216/61904 [15:11<7:21:29,  1.42s/it] 70%|██████▉   | 43217/61904 [15:12<7:12:30,  1.39s/it] 70%|██████▉   | 43218/61904 [15:13<7:13:53,  1.39s/it] 70%|██████▉   | 43219/61904 [15:15<7:06:23,  1.37s/it] 70%|██████▉   | 43220/61904 [15:16<7:07:34,  1.37s/it]                                                       {'loss': 2.4735, 'learning_rate': 1.3028004667444573e-07, 'epoch': 11.17}
 70%|██████▉   | 43220/61904 [15:16<7:07:34,  1.37s/it] 70%|██████▉   | 43221/61904 [15:17<7:10:55,  1.38s/it] 70%|██████▉   | 43222/61904 [15:19<7:08:01,  1.37s/it] 70%|██████▉   | 43223/61904 [15:20<7:01:30,  1.35s/it] 70%|██████▉   | 43224/61904 [15:21<7:09:34,  1.38s/it] 70%|██████▉   | 43225/61904 [15:23<6:58:31,  1.34s/it] 70%|██████▉   | 43226/61904 [15:24<6:56:02,  1.34s/it] 70%|██████▉   | 43227/61904 [15:25<7:04:46,  1.36s/it] 70%|██████▉   | 43228/61904 [15:27<7:04:40,  1.36s/it] 70%|██████▉   | 43229/61904 [15:28<7:09:18,  1.38s/it] 70%|██████▉   | 43230/61904 [15:30<7:11:05,  1.39s/it] 70%|██████▉   | 43231/61904 [15:31<7:09:59,  1.38s/it] 70%|██████▉   | 43232/61904 [15:32<7:12:18,  1.39s/it] 70%|██████▉   | 43233/61904 [15:34<7:10:45,  1.38s/it] 70%|██████▉   | 43234/61904 [15:35<7:24:41,  1.43s/it] 70%|██████▉   | 43235/61904 [15:37<7:21:01,  1.42s/it] 70%|██████▉   | 43236/61904 [15:38<7:16:41,  1.40s/it] 70%|██████▉   | 43237/61904 [15:39<7:06:01,  1.37s/it] 70%|██████▉   | 43238/61904 [15:41<7:00:55,  1.35s/it] 70%|██████▉   | 43239/61904 [15:42<7:09:10,  1.38s/it] 70%|██████▉   | 43240/61904 [15:44<7:11:00,  1.39s/it]                                                       {'loss': 2.5127, 'learning_rate': 1.3024763386490342e-07, 'epoch': 11.18}
 70%|██████▉   | 43240/61904 [15:44<7:11:00,  1.39s/it] 70%|██████▉   | 43241/61904 [15:45<7:32:52,  1.46s/it] 70%|██████▉   | 43242/61904 [15:46<7:13:52,  1.39s/it] 70%|██████▉   | 43243/61904 [15:48<7:33:29,  1.46s/it] 70%|██████▉   | 43244/61904 [15:50<7:48:05,  1.51s/it] 70%|██████▉   | 43245/61904 [15:51<7:44:05,  1.49s/it] 70%|██████▉   | 43246/61904 [15:52<7:31:54,  1.45s/it] 70%|██████▉   | 43247/61904 [15:54<7:34:11,  1.46s/it] 70%|██████▉   | 43248/61904 [15:55<7:27:17,  1.44s/it] 70%|██████▉   | 43249/61904 [15:57<7:13:29,  1.39s/it] 70%|██████▉   | 43250/61904 [15:58<7:07:00,  1.37s/it] 70%|██████▉   | 43251/61904 [15:59<7:16:14,  1.40s/it] 70%|██████▉   | 43252/61904 [16:01<7:27:33,  1.44s/it] 70%|██████▉   | 43253/61904 [16:02<7:17:37,  1.41s/it] 70%|██████▉   | 43254/61904 [16:04<7:31:21,  1.45s/it] 70%|██████▉   | 43255/61904 [16:05<7:34:23,  1.46s/it] 70%|██████▉   | 43256/61904 [16:07<7:19:49,  1.42s/it] 70%|██████▉   | 43257/61904 [16:08<7:13:14,  1.39s/it] 70%|██████▉   | 43258/61904 [16:09<7:21:14,  1.42s/it] 70%|██████▉   | 43259/61904 [16:11<7:30:22,  1.45s/it] 70%|██████▉   | 43260/61904 [16:12<7:16:52,  1.41s/it]                                                       {'loss': 2.4045, 'learning_rate': 1.3021522105536105e-07, 'epoch': 11.18}
 70%|██████▉   | 43260/61904 [16:12<7:16:52,  1.41s/it] 70%|██████▉   | 43261/61904 [16:14<7:23:12,  1.43s/it] 70%|██████▉   | 43262/61904 [16:15<7:09:17,  1.38s/it] 70%|██████▉   | 43263/61904 [16:16<7:09:36,  1.38s/it] 70%|██████▉   | 43264/61904 [16:18<7:26:22,  1.44s/it] 70%|██████▉   | 43265/61904 [16:19<7:29:10,  1.45s/it] 70%|██████▉   | 43266/61904 [16:21<7:18:24,  1.41s/it] 70%|██████▉   | 43267/61904 [16:22<7:07:16,  1.38s/it] 70%|██████▉   | 43268/61904 [16:23<7:13:46,  1.40s/it] 70%|██████▉   | 43269/61904 [16:25<7:07:45,  1.38s/it] 70%|██████▉   | 43270/61904 [16:26<7:04:10,  1.37s/it] 70%|██████▉   | 43271/61904 [16:28<7:03:02,  1.36s/it] 70%|██████▉   | 43272/61904 [16:29<7:19:41,  1.42s/it] 70%|██████▉   | 43273/61904 [16:30<7:04:49,  1.37s/it] 70%|██████▉   | 43274/61904 [16:32<7:04:54,  1.37s/it] 70%|██████▉   | 43275/61904 [16:33<7:18:21,  1.41s/it] 70%|██████▉   | 43276/61904 [16:35<7:18:21,  1.41s/it] 70%|██████▉   | 43277/61904 [16:36<7:08:48,  1.38s/it] 70%|██████▉   | 43278/61904 [16:37<7:07:46,  1.38s/it] 70%|██████▉   | 43279/61904 [16:39<7:20:37,  1.42s/it] 70%|██████▉   | 43280/61904 [16:40<7:24:48,  1.43s/it]                                                       {'loss': 2.4599, 'learning_rate': 1.3018280824581874e-07, 'epoch': 11.19}
 70%|██████▉   | 43280/61904 [16:40<7:24:48,  1.43s/it] 70%|██████▉   | 43281/61904 [16:42<7:28:35,  1.45s/it] 70%|██████▉   | 43282/61904 [16:43<7:20:24,  1.42s/it] 70%|██████▉   | 43283/61904 [16:44<7:08:44,  1.38s/it] 70%|██████▉   | 43284/61904 [16:46<7:05:47,  1.37s/it] 70%|██████▉   | 43285/61904 [16:47<7:07:06,  1.38s/it] 70%|██████▉   | 43286/61904 [16:49<7:07:43,  1.38s/it] 70%|██████▉   | 43287/61904 [16:50<7:09:02,  1.38s/it] 70%|██████▉   | 43288/61904 [16:51<7:16:40,  1.41s/it] 70%|██████▉   | 43289/61904 [16:53<7:13:33,  1.40s/it] 70%|██████▉   | 43290/61904 [16:54<7:09:32,  1.38s/it] 70%|██████▉   | 43291/61904 [16:55<7:05:36,  1.37s/it] 70%|██████▉   | 43292/61904 [16:57<6:54:48,  1.34s/it] 70%|██████▉   | 43293/61904 [16:58<6:48:04,  1.32s/it] 70%|██████▉   | 43294/61904 [16:59<6:56:47,  1.34s/it] 70%|██████▉   | 43295/61904 [17:01<6:54:57,  1.34s/it] 70%|██████▉   | 43296/61904 [17:02<7:24:04,  1.43s/it] 70%|██████▉   | 43297/61904 [17:04<7:30:03,  1.45s/it] 70%|██████▉   | 43298/61904 [17:05<7:36:19,  1.47s/it] 70%|██████▉   | 43299/61904 [17:07<7:40:32,  1.49s/it] 70%|██████▉   | 43300/61904 [17:08<7:35:08,  1.47s/it]                                                       {'loss': 2.4875, 'learning_rate': 1.301503954362764e-07, 'epoch': 11.19}
 70%|██████▉   | 43300/61904 [17:08<7:35:08,  1.47s/it] 70%|██████▉   | 43301/61904 [17:10<7:24:21,  1.43s/it] 70%|██████▉   | 43302/61904 [17:11<7:20:14,  1.42s/it] 70%|██████▉   | 43303/61904 [17:12<7:17:28,  1.41s/it] 70%|██████▉   | 43304/61904 [17:14<7:10:38,  1.39s/it] 70%|██████▉   | 43305/61904 [17:15<7:15:40,  1.41s/it] 70%|██████▉   | 43306/61904 [17:17<7:16:26,  1.41s/it] 70%|██████▉   | 43307/61904 [17:18<7:24:35,  1.43s/it] 70%|██████▉   | 43308/61904 [17:20<7:36:33,  1.47s/it] 70%|██████▉   | 43309/61904 [17:21<7:37:22,  1.48s/it] 70%|██████▉   | 43310/61904 [17:23<7:34:31,  1.47s/it] 70%|██████▉   | 43311/61904 [17:24<7:27:44,  1.44s/it] 70%|██████▉   | 43312/61904 [17:26<7:40:22,  1.49s/it] 70%|██████▉   | 43313/61904 [17:27<7:51:10,  1.52s/it] 70%|██████▉   | 43314/61904 [17:29<7:59:40,  1.55s/it] 70%|██████▉   | 43315/61904 [17:30<7:55:58,  1.54s/it] 70%|██████▉   | 43316/61904 [17:32<7:50:06,  1.52s/it] 70%|██████▉   | 43317/61904 [17:33<7:37:43,  1.48s/it] 70%|██████▉   | 43318/61904 [17:35<7:37:24,  1.48s/it] 70%|██████▉   | 43319/61904 [17:36<7:36:26,  1.47s/it] 70%|██████▉   | 43320/61904 [17:38<7:42:18,  1.49s/it]                                                       {'loss': 2.4523, 'learning_rate': 1.3011798262673407e-07, 'epoch': 11.2}
 70%|██████▉   | 43320/61904 [17:38<7:42:18,  1.49s/it] 70%|██████▉   | 43321/61904 [17:39<7:36:44,  1.47s/it] 70%|██████▉   | 43322/61904 [17:40<7:21:40,  1.43s/it] 70%|██████▉   | 43323/61904 [17:42<7:24:23,  1.44s/it] 70%|██████▉   | 43324/61904 [17:43<7:31:36,  1.46s/it] 70%|██████▉   | 43325/61904 [17:45<7:26:52,  1.44s/it] 70%|██████▉   | 43326/61904 [17:46<7:37:00,  1.48s/it] 70%|██████▉   | 43327/61904 [17:48<7:23:56,  1.43s/it] 70%|██████▉   | 43328/61904 [17:49<7:19:48,  1.42s/it] 70%|██████▉   | 43329/61904 [17:51<7:27:22,  1.45s/it] 70%|██████▉   | 43330/61904 [17:52<7:24:00,  1.43s/it] 70%|██████▉   | 43331/61904 [17:54<7:32:59,  1.46s/it] 70%|██████▉   | 43332/61904 [17:55<7:15:04,  1.41s/it] 70%|███████   | 43333/61904 [17:56<7:03:01,  1.37s/it] 70%|███████   | 43334/61904 [17:57<7:03:25,  1.37s/it] 70%|███████   | 43335/61904 [17:59<7:19:16,  1.42s/it] 70%|███████   | 43336/61904 [18:00<7:22:56,  1.43s/it] 70%|███████   | 43337/61904 [18:02<7:13:53,  1.40s/it] 70%|███████   | 43338/61904 [18:03<7:24:04,  1.44s/it] 70%|███████   | 43339/61904 [18:05<7:10:14,  1.39s/it] 70%|███████   | 43340/61904 [18:06<7:12:32,  1.40s/it]                                                       {'loss': 2.47, 'learning_rate': 1.3008556981719175e-07, 'epoch': 11.2}
 70%|███████   | 43340/61904 [18:06<7:12:32,  1.40s/it] 70%|███████   | 43341/61904 [18:07<7:16:08,  1.41s/it] 70%|███████   | 43342/61904 [18:09<7:16:53,  1.41s/it] 70%|███████   | 43343/61904 [18:10<7:10:07,  1.39s/it] 70%|███████   | 43344/61904 [18:12<7:06:03,  1.38s/it] 70%|███████   | 43345/61904 [18:13<7:10:57,  1.39s/it] 70%|███████   | 43346/61904 [18:14<7:12:45,  1.40s/it] 70%|███████   | 43347/61904 [18:16<7:22:21,  1.43s/it] 70%|███████   | 43348/61904 [18:17<7:12:18,  1.40s/it] 70%|███████   | 43349/61904 [18:18<6:58:37,  1.35s/it] 70%|███████   | 43350/61904 [18:20<6:45:12,  1.31s/it] 70%|███████   | 43351/61904 [18:21<6:55:16,  1.34s/it] 70%|███████   | 43352/61904 [18:22<7:02:37,  1.37s/it] 70%|███████   | 43353/61904 [18:24<6:51:23,  1.33s/it] 70%|███████   | 43354/61904 [18:25<6:52:50,  1.34s/it] 70%|███████   | 43355/61904 [18:26<6:50:58,  1.33s/it] 70%|███████   | 43356/61904 [18:28<6:45:01,  1.31s/it] 70%|███████   | 43357/61904 [18:29<6:43:16,  1.30s/it] 70%|███████   | 43358/61904 [18:30<6:42:20,  1.30s/it] 70%|███████   | 43359/61904 [18:32<6:46:11,  1.31s/it] 70%|███████   | 43360/61904 [18:33<6:50:01,  1.33s/it]                                                       {'loss': 2.464, 'learning_rate': 1.3005315700764942e-07, 'epoch': 11.21}
 70%|███████   | 43360/61904 [18:33<6:50:01,  1.33s/it] 70%|███████   | 43361/61904 [18:34<6:54:52,  1.34s/it] 70%|███████   | 43362/61904 [18:36<7:01:56,  1.37s/it] 70%|███████   | 43363/61904 [18:37<6:58:40,  1.35s/it] 70%|███████   | 43364/61904 [18:38<6:57:40,  1.35s/it] 70%|███████   | 43365/61904 [18:40<6:50:46,  1.33s/it] 70%|███████   | 43366/61904 [18:41<7:01:57,  1.37s/it] 70%|███████   | 43367/61904 [18:43<7:05:48,  1.38s/it] 70%|███████   | 43368/61904 [18:44<7:08:34,  1.39s/it] 70%|███████   | 43369/61904 [18:45<7:04:18,  1.37s/it] 70%|███████   | 43370/61904 [18:47<6:50:03,  1.33s/it] 70%|███████   | 43371/61904 [18:48<6:54:53,  1.34s/it] 70%|███████   | 43372/61904 [18:49<7:07:19,  1.38s/it] 70%|███████   | 43373/61904 [18:51<7:25:13,  1.44s/it] 70%|███████   | 43374/61904 [18:52<7:08:57,  1.39s/it] 70%|███████   | 43375/61904 [18:54<7:03:39,  1.37s/it] 70%|███████   | 43376/61904 [18:55<7:14:18,  1.41s/it] 70%|███████   | 43377/61904 [18:56<7:02:48,  1.37s/it] 70%|███████   | 43378/61904 [18:58<7:11:32,  1.40s/it] 70%|███████   | 43379/61904 [18:59<7:03:05,  1.37s/it] 70%|███████   | 43380/61904 [19:00<6:45:33,  1.31s/it]                                                       {'loss': 2.5223, 'learning_rate': 1.3002074419810708e-07, 'epoch': 11.21}
 70%|███████   | 43380/61904 [19:00<6:45:33,  1.31s/it] 70%|███████   | 43381/61904 [19:02<7:06:29,  1.38s/it] 70%|███████   | 43382/61904 [19:03<7:03:05,  1.37s/it] 70%|███████   | 43383/61904 [19:04<6:59:41,  1.36s/it] 70%|███████   | 43384/61904 [19:06<7:00:25,  1.36s/it] 70%|███████   | 43385/61904 [19:07<7:05:15,  1.38s/it] 70%|███████   | 43386/61904 [19:09<6:55:06,  1.34s/it] 70%|███████   | 43387/61904 [19:10<7:00:28,  1.36s/it] 70%|███████   | 43388/61904 [19:11<7:04:57,  1.38s/it] 70%|███████   | 43389/61904 [19:13<7:00:02,  1.36s/it] 70%|███████   | 43390/61904 [19:14<7:01:02,  1.36s/it] 70%|███████   | 43391/61904 [19:15<7:04:57,  1.38s/it] 70%|███████   | 43392/61904 [19:17<7:12:37,  1.40s/it] 70%|███████   | 43393/61904 [19:18<7:12:25,  1.40s/it] 70%|███████   | 43394/61904 [19:20<6:55:00,  1.35s/it] 70%|███████   | 43395/61904 [19:21<6:41:56,  1.30s/it] 70%|███████   | 43396/61904 [19:22<6:50:58,  1.33s/it] 70%|███████   | 43397/61904 [19:24<7:03:53,  1.37s/it] 70%|███████   | 43398/61904 [19:25<7:09:21,  1.39s/it] 70%|███████   | 43399/61904 [19:27<7:27:59,  1.45s/it] 70%|███████   | 43400/61904 [19:28<7:49:10,  1.52s/it]                                                       {'loss': 2.4749, 'learning_rate': 1.2998833138856477e-07, 'epoch': 11.22}
 70%|███████   | 43400/61904 [19:28<7:49:10,  1.52s/it] 70%|███████   | 43401/61904 [19:30<7:25:39,  1.45s/it] 70%|███████   | 43402/61904 [19:31<7:14:03,  1.41s/it] 70%|███████   | 43403/61904 [19:32<7:06:11,  1.38s/it] 70%|███████   | 43404/61904 [19:34<7:07:03,  1.39s/it] 70%|███████   | 43405/61904 [19:35<7:03:39,  1.37s/it] 70%|███████   | 43406/61904 [19:36<6:53:30,  1.34s/it] 70%|███████   | 43407/61904 [19:38<7:04:32,  1.38s/it] 70%|███████   | 43408/61904 [19:39<7:06:34,  1.38s/it] 70%|███████   | 43409/61904 [19:40<7:06:48,  1.38s/it] 70%|███████   | 43410/61904 [19:42<7:03:49,  1.38s/it] 70%|███████   | 43411/61904 [19:43<6:54:35,  1.35s/it] 70%|███████   | 43412/61904 [19:44<6:55:40,  1.35s/it] 70%|███████   | 43413/61904 [19:46<6:44:01,  1.31s/it] 70%|███████   | 43414/61904 [19:47<6:43:07,  1.31s/it] 70%|███████   | 43415/61904 [19:48<6:45:32,  1.32s/it] 70%|███████   | 43416/61904 [19:50<6:58:47,  1.36s/it] 70%|███████   | 43417/61904 [19:51<6:58:03,  1.36s/it] 70%|███████   | 43418/61904 [19:53<7:16:47,  1.42s/it] 70%|███████   | 43419/61904 [19:54<7:04:29,  1.38s/it] 70%|███████   | 43420/61904 [19:55<7:10:28,  1.40s/it]                                                       {'loss': 2.5268, 'learning_rate': 1.2995591857902243e-07, 'epoch': 11.22}
 70%|███████   | 43420/61904 [19:55<7:10:28,  1.40s/it] 70%|███████   | 43421/61904 [19:57<7:15:55,  1.42s/it] 70%|███████   | 43422/61904 [19:58<7:11:15,  1.40s/it] 70%|███████   | 43423/61904 [20:00<7:11:40,  1.40s/it] 70%|███████   | 43424/61904 [20:01<7:14:33,  1.41s/it] 70%|███████   | 43425/61904 [20:03<7:19:32,  1.43s/it] 70%|███████   | 43426/61904 [20:04<7:10:48,  1.40s/it] 70%|███████   | 43427/61904 [20:05<6:54:59,  1.35s/it] 70%|███████   | 43428/61904 [20:07<7:24:42,  1.44s/it] 70%|███████   | 43429/61904 [20:08<7:23:09,  1.44s/it] 70%|███████   | 43430/61904 [20:09<7:08:40,  1.39s/it] 70%|███████   | 43431/61904 [20:11<7:11:45,  1.40s/it] 70%|███████   | 43432/61904 [20:12<7:28:48,  1.46s/it] 70%|███████   | 43433/61904 [20:14<7:21:05,  1.43s/it] 70%|███████   | 43434/61904 [20:15<7:17:22,  1.42s/it] 70%|███████   | 43435/61904 [20:17<7:12:54,  1.41s/it] 70%|███████   | 43436/61904 [20:18<7:16:22,  1.42s/it] 70%|███████   | 43437/61904 [20:19<7:06:38,  1.39s/it] 70%|███████   | 43438/61904 [20:21<7:04:01,  1.38s/it] 70%|███████   | 43439/61904 [20:22<6:49:54,  1.33s/it] 70%|███████   | 43440/61904 [20:23<6:53:04,  1.34s/it]                                                       {'loss': 2.4837, 'learning_rate': 1.299235057694801e-07, 'epoch': 11.23}
 70%|███████   | 43440/61904 [20:23<6:53:04,  1.34s/it] 70%|███████   | 43441/61904 [20:25<6:43:53,  1.31s/it] 70%|███████   | 43442/61904 [20:26<6:48:31,  1.33s/it] 70%|███████   | 43443/61904 [20:27<6:54:52,  1.35s/it] 70%|███████   | 43444/61904 [20:29<6:59:44,  1.36s/it] 70%|███████   | 43445/61904 [20:30<6:55:55,  1.35s/it] 70%|███████   | 43446/61904 [20:31<6:54:01,  1.35s/it] 70%|███████   | 43447/61904 [20:33<7:00:04,  1.37s/it] 70%|███████   | 43448/61904 [20:34<6:52:40,  1.34s/it] 70%|███████   | 43449/61904 [20:36<7:04:04,  1.38s/it] 70%|███████   | 43450/61904 [20:37<7:08:49,  1.39s/it] 70%|███████   | 43451/61904 [20:38<7:10:00,  1.40s/it] 70%|███████   | 43452/61904 [20:40<7:06:33,  1.39s/it] 70%|███████   | 43453/61904 [20:41<7:04:07,  1.38s/it] 70%|███████   | 43454/61904 [20:43<7:09:52,  1.40s/it] 70%|███████   | 43455/61904 [20:44<7:08:58,  1.40s/it] 70%|███████   | 43456/61904 [20:45<7:00:41,  1.37s/it] 70%|███████   | 43457/61904 [20:47<7:02:05,  1.37s/it] 70%|███████   | 43458/61904 [20:48<7:03:06,  1.38s/it] 70%|███████   | 43459/61904 [20:49<6:59:48,  1.37s/it] 70%|███████   | 43460/61904 [20:51<6:49:29,  1.33s/it]                                                       {'loss': 2.4285, 'learning_rate': 1.2989109295993778e-07, 'epoch': 11.23}
 70%|███████   | 43460/61904 [20:51<6:49:29,  1.33s/it] 70%|███████   | 43461/61904 [20:52<6:45:40,  1.32s/it] 70%|███████   | 43462/61904 [20:53<6:49:34,  1.33s/it] 70%|███████   | 43463/61904 [20:55<6:57:07,  1.36s/it] 70%|███████   | 43464/61904 [20:56<6:46:21,  1.32s/it] 70%|███████   | 43465/61904 [20:57<7:01:35,  1.37s/it] 70%|███████   | 43466/61904 [20:59<6:51:34,  1.34s/it] 70%|███████   | 43467/61904 [21:00<6:52:41,  1.34s/it] 70%|███████   | 43468/61904 [21:01<6:58:13,  1.36s/it] 70%|███████   | 43469/61904 [21:03<7:04:06,  1.38s/it] 70%|███████   | 43470/61904 [21:04<7:12:43,  1.41s/it] 70%|███████   | 43471/61904 [21:06<7:16:28,  1.42s/it] 70%|███████   | 43472/61904 [21:07<7:08:21,  1.39s/it] 70%|███████   | 43473/61904 [21:08<7:03:05,  1.38s/it] 70%|███████   | 43474/61904 [21:10<7:03:13,  1.38s/it] 70%|███████   | 43475/61904 [21:11<7:06:33,  1.39s/it] 70%|███████   | 43476/61904 [21:13<7:03:30,  1.38s/it] 70%|███████   | 43477/61904 [21:14<7:04:49,  1.38s/it] 70%|███████   | 43478/61904 [21:15<7:10:02,  1.40s/it] 70%|███████   | 43479/61904 [21:17<7:03:27,  1.38s/it] 70%|███████   | 43480/61904 [21:18<7:00:31,  1.37s/it]                                                       {'loss': 2.4918, 'learning_rate': 1.2985868015039541e-07, 'epoch': 11.24}
 70%|███████   | 43480/61904 [21:18<7:00:31,  1.37s/it] 70%|███████   | 43481/61904 [21:19<6:51:12,  1.34s/it] 70%|███████   | 43482/61904 [21:21<6:47:29,  1.33s/it] 70%|███████   | 43483/61904 [21:22<6:47:30,  1.33s/it] 70%|███████   | 43484/61904 [21:23<6:58:58,  1.36s/it] 70%|███████   | 43485/61904 [21:25<6:54:53,  1.35s/it] 70%|███████   | 43486/61904 [21:26<6:56:22,  1.36s/it] 70%|███████   | 43487/61904 [21:28<7:04:24,  1.38s/it] 70%|███████   | 43488/61904 [21:29<6:45:29,  1.32s/it] 70%|███████   | 43489/61904 [21:30<6:42:31,  1.31s/it] 70%|███████   | 43490/61904 [21:32<6:56:33,  1.36s/it] 70%|███████   | 43491/61904 [21:33<7:17:28,  1.43s/it] 70%|███████   | 43492/61904 [21:34<7:10:51,  1.40s/it] 70%|███████   | 43493/61904 [21:36<7:01:35,  1.37s/it] 70%|███████   | 43494/61904 [21:37<6:57:07,  1.36s/it] 70%|███████   | 43495/61904 [21:38<6:59:14,  1.37s/it] 70%|███████   | 43496/61904 [21:40<6:54:44,  1.35s/it] 70%|███████   | 43497/61904 [21:41<6:53:40,  1.35s/it] 70%|███████   | 43498/61904 [21:42<6:45:18,  1.32s/it] 70%|███████   | 43499/61904 [21:44<6:53:42,  1.35s/it] 70%|███████   | 43500/61904 [21:45<6:56:08,  1.36s/it]                                                       {'loss': 2.4585, 'learning_rate': 1.298262673408531e-07, 'epoch': 11.24}
 70%|███████   | 43500/61904 [21:45<6:56:08,  1.36s/it] 70%|███████   | 43501/61904 [21:47<7:15:28,  1.42s/it] 70%|███████   | 43502/61904 [21:48<7:15:19,  1.42s/it] 70%|███████   | 43503/61904 [21:49<7:05:57,  1.39s/it] 70%|███████   | 43504/61904 [21:51<7:00:16,  1.37s/it] 70%|███████   | 43505/61904 [21:52<6:56:33,  1.36s/it] 70%|███████   | 43506/61904 [21:53<6:52:04,  1.34s/it] 70%|███████   | 43507/61904 [21:55<6:48:27,  1.33s/it] 70%|███████   | 43508/61904 [21:56<6:51:09,  1.34s/it] 70%|███████   | 43509/61904 [21:58<6:55:01,  1.35s/it] 70%|███████   | 43510/61904 [21:59<7:00:01,  1.37s/it] 70%|███████   | 43511/61904 [22:00<7:19:33,  1.43s/it] 70%|███████   | 43512/61904 [22:02<7:05:18,  1.39s/it] 70%|███████   | 43513/61904 [22:03<7:03:48,  1.38s/it] 70%|███████   | 43514/61904 [22:04<7:00:42,  1.37s/it] 70%|███████   | 43515/61904 [22:06<7:14:59,  1.42s/it] 70%|███████   | 43516/61904 [22:07<7:00:35,  1.37s/it] 70%|███████   | 43517/61904 [22:09<7:09:21,  1.40s/it] 70%|███████   | 43518/61904 [22:10<7:09:42,  1.40s/it] 70%|███████   | 43519/61904 [22:12<7:24:01,  1.45s/it] 70%|███████   | 43520/61904 [22:13<7:19:54,  1.44s/it]                                                       {'loss': 2.5156, 'learning_rate': 1.2979385453131076e-07, 'epoch': 11.25}
 70%|███████   | 43520/61904 [22:13<7:19:54,  1.44s/it] 70%|███████   | 43521/61904 [22:15<7:19:28,  1.43s/it] 70%|███████   | 43522/61904 [22:16<7:32:36,  1.48s/it] 70%|███████   | 43523/61904 [22:18<7:23:48,  1.45s/it] 70%|███████   | 43524/61904 [22:19<7:14:55,  1.42s/it] 70%|███████   | 43525/61904 [22:20<7:11:22,  1.41s/it] 70%|███████   | 43526/61904 [22:22<7:02:06,  1.38s/it] 70%|███████   | 43527/61904 [22:23<6:59:07,  1.37s/it] 70%|███████   | 43528/61904 [22:24<7:02:28,  1.38s/it] 70%|███████   | 43529/61904 [22:26<7:12:28,  1.41s/it] 70%|███████   | 43530/61904 [22:27<6:59:28,  1.37s/it] 70%|███████   | 43531/61904 [22:28<6:50:10,  1.34s/it] 70%|███████   | 43532/61904 [22:30<6:39:51,  1.31s/it] 70%|███████   | 43533/61904 [22:31<6:51:19,  1.34s/it] 70%|███████   | 43534/61904 [22:32<6:55:23,  1.36s/it] 70%|███████   | 43535/61904 [22:34<6:54:41,  1.35s/it] 70%|███████   | 43536/61904 [22:35<6:51:03,  1.34s/it] 70%|███████   | 43537/61904 [22:36<6:45:34,  1.32s/it] 70%|███████   | 43538/61904 [22:38<6:45:10,  1.32s/it] 70%|███████   | 43539/61904 [22:39<6:51:49,  1.35s/it] 70%|███████   | 43540/61904 [22:40<6:54:48,  1.36s/it]                                                       {'loss': 2.5031, 'learning_rate': 1.2976144172176843e-07, 'epoch': 11.25}
 70%|███████   | 43540/61904 [22:40<6:54:48,  1.36s/it] 70%|███████   | 43541/61904 [22:42<7:01:03,  1.38s/it] 70%|███████   | 43542/61904 [22:43<7:04:21,  1.39s/it] 70%|███████   | 43543/61904 [22:45<7:01:50,  1.38s/it] 70%|███████   | 43544/61904 [22:46<6:51:44,  1.35s/it] 70%|███████   | 43545/61904 [22:47<6:46:04,  1.33s/it] 70%|███████   | 43546/61904 [22:48<6:37:16,  1.30s/it] 70%|███████   | 43547/61904 [22:50<6:40:59,  1.31s/it] 70%|███████   | 43548/61904 [22:51<6:43:02,  1.32s/it] 70%|███████   | 43549/61904 [22:53<6:58:34,  1.37s/it] 70%|███████   | 43550/61904 [22:54<7:03:33,  1.38s/it] 70%|███████   | 43551/61904 [22:55<7:15:15,  1.42s/it] 70%|███████   | 43552/61904 [22:57<7:32:24,  1.48s/it] 70%|███████   | 43553/61904 [22:58<7:13:51,  1.42s/it] 70%|███████   | 43554/61904 [23:00<7:18:38,  1.43s/it] 70%|███████   | 43555/61904 [23:01<7:19:48,  1.44s/it] 70%|███████   | 43556/61904 [23:03<7:14:09,  1.42s/it] 70%|███████   | 43557/61904 [23:04<6:59:53,  1.37s/it] 70%|███████   | 43558/61904 [23:05<7:05:23,  1.39s/it] 70%|███████   | 43559/61904 [23:07<6:56:14,  1.36s/it] 70%|███████   | 43560/61904 [23:08<6:56:42,  1.36s/it]                                                       {'loss': 2.456, 'learning_rate': 1.2972902891222611e-07, 'epoch': 11.26}
 70%|███████   | 43560/61904 [23:08<6:56:42,  1.36s/it] 70%|███████   | 43561/61904 [23:09<6:47:39,  1.33s/it] 70%|███████   | 43562/61904 [23:11<6:51:17,  1.35s/it] 70%|███████   | 43563/61904 [23:12<6:54:54,  1.36s/it] 70%|███████   | 43564/61904 [23:13<7:00:34,  1.38s/it] 70%|███████   | 43565/61904 [23:15<6:54:15,  1.36s/it] 70%|███████   | 43566/61904 [23:16<7:09:38,  1.41s/it] 70%|███████   | 43567/61904 [23:18<7:01:30,  1.38s/it] 70%|███████   | 43568/61904 [23:19<6:52:44,  1.35s/it] 70%|███████   | 43569/61904 [23:20<7:01:04,  1.38s/it] 70%|███████   | 43570/61904 [23:22<6:54:06,  1.36s/it] 70%|███████   | 43571/61904 [23:23<7:06:43,  1.40s/it] 70%|███████   | 43572/61904 [23:24<6:51:38,  1.35s/it] 70%|███████   | 43573/61904 [23:26<7:04:14,  1.39s/it] 70%|███████   | 43574/61904 [23:27<7:06:37,  1.40s/it] 70%|███████   | 43575/61904 [23:29<6:51:56,  1.35s/it] 70%|███████   | 43576/61904 [23:30<6:56:06,  1.36s/it] 70%|███████   | 43577/61904 [23:31<6:56:27,  1.36s/it] 70%|███████   | 43578/61904 [23:33<6:50:20,  1.34s/it] 70%|███████   | 43579/61904 [23:34<7:01:00,  1.38s/it] 70%|███████   | 43580/61904 [23:35<6:55:21,  1.36s/it]                                                       {'loss': 2.5083, 'learning_rate': 1.2969661610268378e-07, 'epoch': 11.26}
 70%|███████   | 43580/61904 [23:35<6:55:21,  1.36s/it] 70%|███████   | 43581/61904 [23:37<6:54:54,  1.36s/it] 70%|███████   | 43582/61904 [23:38<6:52:09,  1.35s/it] 70%|███████   | 43583/61904 [23:39<6:49:42,  1.34s/it] 70%|███████   | 43584/61904 [23:41<6:55:44,  1.36s/it] 70%|███████   | 43585/61904 [23:42<7:10:18,  1.41s/it] 70%|███████   | 43586/61904 [23:44<7:19:00,  1.44s/it] 70%|███████   | 43587/61904 [23:45<6:59:22,  1.37s/it] 70%|███████   | 43588/61904 [23:46<7:05:10,  1.39s/it] 70%|███████   | 43589/61904 [23:48<7:33:53,  1.49s/it] 70%|███████   | 43590/61904 [23:49<7:17:32,  1.43s/it] 70%|███████   | 43591/61904 [23:51<7:08:47,  1.40s/it] 70%|███████   | 43592/61904 [23:52<7:06:58,  1.40s/it] 70%|███████   | 43593/61904 [23:54<7:12:54,  1.42s/it] 70%|███████   | 43594/61904 [23:55<7:22:33,  1.45s/it] 70%|███████   | 43595/61904 [23:57<7:25:49,  1.46s/it] 70%|███████   | 43596/61904 [23:58<7:07:26,  1.40s/it] 70%|███████   | 43597/61904 [23:59<7:05:21,  1.39s/it] 70%|███████   | 43598/61904 [24:01<7:10:37,  1.41s/it] 70%|███████   | 43599/61904 [24:02<7:09:54,  1.41s/it] 70%|███████   | 43600/61904 [24:03<6:59:44,  1.38s/it]                                                       {'loss': 2.5241, 'learning_rate': 1.2966420329314144e-07, 'epoch': 11.27}
 70%|███████   | 43600/61904 [24:03<6:59:44,  1.38s/it] 70%|███████   | 43601/61904 [24:05<6:57:50,  1.37s/it] 70%|███████   | 43602/61904 [24:06<7:06:29,  1.40s/it] 70%|███████   | 43603/61904 [24:08<6:53:23,  1.36s/it] 70%|███████   | 43604/61904 [24:09<6:56:10,  1.36s/it] 70%|███████   | 43605/61904 [24:10<7:05:34,  1.40s/it] 70%|███████   | 43606/61904 [24:12<7:11:05,  1.41s/it] 70%|███████   | 43607/61904 [24:13<7:07:43,  1.40s/it] 70%|███████   | 43608/61904 [24:15<7:04:55,  1.39s/it] 70%|███████   | 43609/61904 [24:16<7:06:53,  1.40s/it] 70%|███████   | 43610/61904 [24:17<7:02:26,  1.39s/it] 70%|███████   | 43611/61904 [24:19<7:03:28,  1.39s/it] 70%|███████   | 43612/61904 [24:20<6:52:37,  1.35s/it] 70%|███████   | 43613/61904 [24:21<6:40:31,  1.31s/it] 70%|███████   | 43614/61904 [24:23<6:43:51,  1.32s/it] 70%|███████   | 43615/61904 [24:24<6:48:36,  1.34s/it] 70%|███████   | 43616/61904 [24:25<6:54:33,  1.36s/it] 70%|███████   | 43617/61904 [24:27<6:55:53,  1.36s/it] 70%|███████   | 43618/61904 [24:28<6:48:38,  1.34s/it] 70%|███████   | 43619/61904 [24:30<7:00:29,  1.38s/it] 70%|███████   | 43620/61904 [24:31<7:21:34,  1.45s/it]                                                       {'loss': 2.4751, 'learning_rate': 1.2963179048359913e-07, 'epoch': 11.27}
 70%|███████   | 43620/61904 [24:31<7:21:34,  1.45s/it] 70%|███████   | 43621/61904 [24:32<7:10:40,  1.41s/it] 70%|███████   | 43622/61904 [24:34<7:17:47,  1.44s/it] 70%|███████   | 43623/61904 [24:35<7:26:02,  1.46s/it] 70%|███████   | 43624/61904 [24:37<7:26:31,  1.47s/it] 70%|███████   | 43625/61904 [24:38<7:13:37,  1.42s/it] 70%|███████   | 43626/61904 [24:40<7:28:56,  1.47s/it] 70%|███████   | 43627/61904 [24:41<7:17:36,  1.44s/it] 70%|███████   | 43628/61904 [24:43<7:06:06,  1.40s/it] 70%|███████   | 43629/61904 [24:44<7:33:46,  1.49s/it] 70%|███████   | 43630/61904 [24:46<7:24:09,  1.46s/it] 70%|███████   | 43631/61904 [24:47<7:29:17,  1.48s/it] 70%|███████   | 43632/61904 [24:48<7:11:12,  1.42s/it] 70%|███████   | 43633/61904 [24:50<7:03:32,  1.39s/it] 70%|███████   | 43634/61904 [24:51<7:08:59,  1.41s/it] 70%|███████   | 43635/61904 [24:52<6:59:41,  1.38s/it] 70%|███████   | 43636/61904 [24:54<6:54:38,  1.36s/it] 70%|███████   | 43637/61904 [24:55<7:18:08,  1.44s/it] 70%|███████   | 43638/61904 [24:57<7:08:37,  1.41s/it] 70%|███████   | 43639/61904 [24:58<7:09:49,  1.41s/it] 70%|███████   | 43640/61904 [25:00<7:08:21,  1.41s/it]                                                       {'loss': 2.4695, 'learning_rate': 1.295993776740568e-07, 'epoch': 11.28}
 70%|███████   | 43640/61904 [25:00<7:08:21,  1.41s/it] 70%|███████   | 43641/61904 [25:01<7:20:32,  1.45s/it] 70%|███████   | 43642/61904 [25:03<7:22:18,  1.45s/it] 71%|███████   | 43643/61904 [25:04<7:28:25,  1.47s/it] 71%|███████   | 43644/61904 [25:06<7:25:03,  1.46s/it] 71%|███████   | 43645/61904 [25:07<7:09:58,  1.41s/it] 71%|███████   | 43646/61904 [25:08<7:01:42,  1.39s/it] 71%|███████   | 43647/61904 [25:09<6:50:31,  1.35s/it] 71%|███████   | 43648/61904 [25:11<6:42:54,  1.32s/it] 71%|███████   | 43649/61904 [25:12<6:53:32,  1.36s/it] 71%|███████   | 43650/61904 [25:13<6:43:51,  1.33s/it] 71%|███████   | 43651/61904 [25:15<6:46:37,  1.34s/it] 71%|███████   | 43652/61904 [25:16<6:45:49,  1.33s/it] 71%|███████   | 43653/61904 [25:17<6:44:09,  1.33s/it] 71%|███████   | 43654/61904 [25:19<7:08:33,  1.41s/it] 71%|███████   | 43655/61904 [25:20<7:03:09,  1.39s/it] 71%|███████   | 43656/61904 [25:22<6:55:51,  1.37s/it] 71%|███████   | 43657/61904 [25:23<7:04:01,  1.39s/it] 71%|███████   | 43658/61904 [25:24<7:03:09,  1.39s/it] 71%|███████   | 43659/61904 [25:26<7:08:09,  1.41s/it] 71%|███████   | 43660/61904 [25:27<6:58:08,  1.38s/it]                                                       {'loss': 2.5578, 'learning_rate': 1.2956696486451445e-07, 'epoch': 11.28}
 71%|███████   | 43660/61904 [25:27<6:58:08,  1.38s/it] 71%|███████   | 43661/61904 [25:29<7:11:22,  1.42s/it] 71%|███████   | 43662/61904 [25:30<7:06:13,  1.40s/it] 71%|███████   | 43663/61904 [25:31<7:02:58,  1.39s/it] 71%|███████   | 43664/61904 [25:33<6:59:27,  1.38s/it] 71%|███████   | 43665/61904 [25:34<6:49:44,  1.35s/it] 71%|███████   | 43666/61904 [25:36<7:00:58,  1.38s/it] 71%|███████   | 43667/61904 [25:37<7:01:12,  1.39s/it] 71%|███████   | 43668/61904 [25:38<6:51:17,  1.35s/it] 71%|███████   | 43669/61904 [25:40<6:45:40,  1.33s/it] 71%|███████   | 43670/61904 [25:41<6:43:01,  1.33s/it] 71%|███████   | 43671/61904 [25:42<6:41:54,  1.32s/it] 71%|███████   | 43672/61904 [25:43<6:42:22,  1.32s/it] 71%|███████   | 43673/61904 [25:45<6:36:57,  1.31s/it] 71%|███████   | 43674/61904 [25:46<6:50:09,  1.35s/it] 71%|███████   | 43675/61904 [25:47<6:39:53,  1.32s/it] 71%|███████   | 43676/61904 [25:49<6:39:13,  1.31s/it] 71%|███████   | 43677/61904 [25:50<6:29:53,  1.28s/it] 71%|███████   | 43678/61904 [25:51<6:34:48,  1.30s/it] 71%|███████   | 43679/61904 [25:53<6:41:46,  1.32s/it] 71%|███████   | 43680/61904 [25:54<6:38:47,  1.31s/it]                                                       {'loss': 2.4649, 'learning_rate': 1.2953455205497214e-07, 'epoch': 11.29}
 71%|███████   | 43680/61904 [25:54<6:38:47,  1.31s/it] 71%|███████   | 43681/61904 [25:55<6:43:26,  1.33s/it] 71%|███████   | 43682/61904 [25:57<6:49:38,  1.35s/it] 71%|███████   | 43683/61904 [25:58<6:50:00,  1.35s/it] 71%|███████   | 43684/61904 [26:00<7:03:51,  1.40s/it] 71%|███████   | 43685/61904 [26:01<7:03:58,  1.40s/it] 71%|███████   | 43686/61904 [26:02<7:01:51,  1.39s/it] 71%|███████   | 43687/61904 [26:04<7:13:22,  1.43s/it] 71%|███████   | 43688/61904 [26:05<6:57:17,  1.37s/it] 71%|███████   | 43689/61904 [26:07<7:00:31,  1.39s/it] 71%|███████   | 43690/61904 [26:08<7:01:32,  1.39s/it] 71%|███████   | 43691/61904 [26:09<7:01:18,  1.39s/it] 71%|███████   | 43692/61904 [26:11<7:12:03,  1.42s/it] 71%|███████   | 43693/61904 [26:12<7:02:31,  1.39s/it] 71%|███████   | 43694/61904 [26:13<6:50:53,  1.35s/it] 71%|███████   | 43695/61904 [26:15<6:45:37,  1.34s/it] 71%|███████   | 43696/61904 [26:16<6:48:03,  1.34s/it] 71%|███████   | 43697/61904 [26:17<6:42:11,  1.33s/it] 71%|███████   | 43698/61904 [26:19<6:47:02,  1.34s/it] 71%|███████   | 43699/61904 [26:20<6:50:04,  1.35s/it] 71%|███████   | 43700/61904 [26:21<6:36:26,  1.31s/it]                                                       {'loss': 2.4747, 'learning_rate': 1.2950213924542977e-07, 'epoch': 11.29}
 71%|███████   | 43700/61904 [26:21<6:36:26,  1.31s/it] 71%|███████   | 43701/61904 [26:23<6:41:13,  1.32s/it] 71%|███████   | 43702/61904 [26:24<6:53:27,  1.36s/it] 71%|███████   | 43703/61904 [26:25<6:48:27,  1.35s/it] 71%|███████   | 43704/61904 [26:27<6:45:03,  1.34s/it] 71%|███████   | 43705/61904 [26:29<7:24:29,  1.47s/it] 71%|███████   | 43706/61904 [26:30<7:18:34,  1.45s/it] 71%|███████   | 43707/61904 [26:31<7:24:36,  1.47s/it] 71%|███████   | 43708/61904 [26:33<7:26:36,  1.47s/it] 71%|███████   | 43709/61904 [26:34<7:10:23,  1.42s/it] 71%|███████   | 43710/61904 [26:35<6:53:55,  1.37s/it] 71%|███████   | 43711/61904 [26:37<7:03:14,  1.40s/it] 71%|███████   | 43712/61904 [26:38<6:54:37,  1.37s/it] 71%|███████   | 43713/61904 [26:40<6:54:33,  1.37s/it] 71%|███████   | 43714/61904 [26:41<6:51:55,  1.36s/it] 71%|███████   | 43715/61904 [26:42<6:55:43,  1.37s/it] 71%|███████   | 43716/61904 [26:44<7:01:43,  1.39s/it] 71%|███████   | 43717/61904 [26:45<6:55:03,  1.37s/it] 71%|███████   | 43718/61904 [26:46<6:57:19,  1.38s/it] 71%|███████   | 43719/61904 [26:48<7:01:49,  1.39s/it] 71%|███████   | 43720/61904 [26:49<6:59:04,  1.38s/it]                                                       {'loss': 2.4679, 'learning_rate': 1.2946972643588746e-07, 'epoch': 11.3}
 71%|███████   | 43720/61904 [26:49<6:59:04,  1.38s/it] 71%|███████   | 43721/61904 [26:51<7:01:50,  1.39s/it] 71%|███████   | 43722/61904 [26:52<7:14:09,  1.43s/it] 71%|███████   | 43723/61904 [26:54<7:12:05,  1.43s/it] 71%|███████   | 43724/61904 [26:55<7:03:34,  1.40s/it] 71%|███████   | 43725/61904 [26:56<7:06:16,  1.41s/it] 71%|███████   | 43726/61904 [26:58<7:08:02,  1.41s/it] 71%|███████   | 43727/61904 [26:59<7:12:11,  1.43s/it] 71%|███████   | 43728/61904 [27:01<7:08:03,  1.41s/it] 71%|███████   | 43729/61904 [27:02<7:00:36,  1.39s/it] 71%|███████   | 43730/61904 [27:03<7:10:40,  1.42s/it] 71%|███████   | 43731/61904 [27:05<6:57:33,  1.38s/it] 71%|███████   | 43732/61904 [27:06<7:03:50,  1.40s/it] 71%|███████   | 43733/61904 [27:08<7:21:28,  1.46s/it] 71%|███████   | 43734/61904 [27:09<7:18:38,  1.45s/it] 71%|███████   | 43735/61904 [27:11<7:19:13,  1.45s/it] 71%|███████   | 43736/61904 [27:12<7:19:08,  1.45s/it] 71%|███████   | 43737/61904 [27:14<7:13:35,  1.43s/it] 71%|███████   | 43738/61904 [27:15<7:07:48,  1.41s/it] 71%|███████   | 43739/61904 [27:16<7:14:05,  1.43s/it] 71%|███████   | 43740/61904 [27:18<7:14:12,  1.43s/it]                                                       {'loss': 2.4683, 'learning_rate': 1.2943731362634512e-07, 'epoch': 11.31}
 71%|███████   | 43740/61904 [27:18<7:14:12,  1.43s/it] 71%|███████   | 43741/61904 [27:19<7:10:54,  1.42s/it] 71%|███████   | 43742/61904 [27:21<7:08:59,  1.42s/it] 71%|███████   | 43743/61904 [27:22<6:54:22,  1.37s/it] 71%|███████   | 43744/61904 [27:23<6:59:35,  1.39s/it] 71%|███████   | 43745/61904 [27:25<7:01:20,  1.39s/it] 71%|███████   | 43746/61904 [27:26<7:02:13,  1.40s/it] 71%|███████   | 43747/61904 [27:27<6:58:06,  1.38s/it] 71%|███████   | 43748/61904 [27:29<7:05:20,  1.41s/it] 71%|███████   | 43749/61904 [27:30<6:59:31,  1.39s/it] 71%|███████   | 43750/61904 [27:32<7:02:37,  1.40s/it] 71%|███████   | 43751/61904 [27:33<6:53:39,  1.37s/it] 71%|███████   | 43752/61904 [27:34<6:55:47,  1.37s/it] 71%|███████   | 43753/61904 [27:36<6:51:04,  1.36s/it] 71%|███████   | 43754/61904 [27:37<6:46:20,  1.34s/it] 71%|███████   | 43755/61904 [27:38<6:41:02,  1.33s/it] 71%|███████   | 43756/61904 [27:40<6:55:47,  1.37s/it] 71%|███████   | 43757/61904 [27:41<7:06:07,  1.41s/it] 71%|███████   | 43758/61904 [27:43<7:05:34,  1.41s/it] 71%|███████   | 43759/61904 [27:44<7:06:53,  1.41s/it] 71%|███████   | 43760/61904 [27:45<6:57:08,  1.38s/it]                                                       {'loss': 2.4857, 'learning_rate': 1.2940490081680279e-07, 'epoch': 11.31}
 71%|███████   | 43760/61904 [27:45<6:57:08,  1.38s/it] 71%|███████   | 43761/61904 [27:47<6:54:31,  1.37s/it] 71%|███████   | 43762/61904 [27:48<6:48:42,  1.35s/it] 71%|███████   | 43763/61904 [27:49<6:36:46,  1.31s/it] 71%|███████   | 43764/61904 [27:51<6:50:10,  1.36s/it] 71%|███████   | 43765/61904 [27:52<6:45:15,  1.34s/it] 71%|███████   | 43766/61904 [27:53<6:46:40,  1.35s/it] 71%|███████   | 43767/61904 [27:55<6:54:42,  1.37s/it] 71%|███████   | 43768/61904 [27:56<6:49:47,  1.36s/it] 71%|███████   | 43769/61904 [27:58<6:52:57,  1.37s/it] 71%|███████   | 43770/61904 [27:59<7:00:51,  1.39s/it] 71%|███████   | 43771/61904 [28:00<6:59:15,  1.39s/it] 71%|███████   | 43772/61904 [28:02<6:55:51,  1.38s/it] 71%|███████   | 43773/61904 [28:03<7:04:47,  1.41s/it] 71%|███████   | 43774/61904 [28:05<7:00:54,  1.39s/it] 71%|███████   | 43775/61904 [28:06<6:55:51,  1.38s/it] 71%|███████   | 43776/61904 [28:07<6:58:11,  1.38s/it] 71%|███████   | 43777/61904 [28:09<6:51:25,  1.36s/it] 71%|███████   | 43778/61904 [28:10<6:57:29,  1.38s/it] 71%|███████   | 43779/61904 [28:11<6:58:40,  1.39s/it] 71%|███████   | 43780/61904 [28:13<7:07:47,  1.42s/it]                                                       {'loss': 2.426, 'learning_rate': 1.2937248800726047e-07, 'epoch': 11.32}
 71%|███████   | 43780/61904 [28:13<7:07:47,  1.42s/it] 71%|███████   | 43781/61904 [28:14<7:11:25,  1.43s/it] 71%|███████   | 43782/61904 [28:16<7:03:31,  1.40s/it] 71%|███████   | 43783/61904 [28:17<7:05:43,  1.41s/it] 71%|███████   | 43784/61904 [28:19<7:18:55,  1.45s/it] 71%|███████   | 43785/61904 [28:20<7:33:03,  1.50s/it] 71%|███████   | 43786/61904 [28:22<7:27:10,  1.48s/it] 71%|███████   | 43787/61904 [28:23<7:19:19,  1.45s/it] 71%|███████   | 43788/61904 [28:25<7:17:56,  1.45s/it] 71%|███████   | 43789/61904 [28:26<7:09:05,  1.42s/it] 71%|███████   | 43790/61904 [28:27<7:02:46,  1.40s/it] 71%|███████   | 43791/61904 [28:29<6:53:35,  1.37s/it] 71%|███████   | 43792/61904 [28:30<7:10:45,  1.43s/it] 71%|███████   | 43793/61904 [28:31<7:01:58,  1.40s/it] 71%|███████   | 43794/61904 [28:33<7:03:20,  1.40s/it] 71%|███████   | 43795/61904 [28:34<7:01:54,  1.40s/it] 71%|███████   | 43796/61904 [28:36<7:06:10,  1.41s/it] 71%|███████   | 43797/61904 [28:37<7:12:41,  1.43s/it] 71%|███████   | 43798/61904 [28:39<7:13:08,  1.44s/it] 71%|███████   | 43799/61904 [28:40<7:20:47,  1.46s/it] 71%|███████   | 43800/61904 [28:42<7:15:28,  1.44s/it]                                                       {'loss': 2.4733, 'learning_rate': 1.2934007519771814e-07, 'epoch': 11.32}
 71%|███████   | 43800/61904 [28:42<7:15:28,  1.44s/it] 71%|███████   | 43801/61904 [28:43<7:10:40,  1.43s/it] 71%|███████   | 43802/61904 [28:44<6:53:03,  1.37s/it] 71%|███████   | 43803/61904 [28:45<6:46:45,  1.35s/it] 71%|███████   | 43804/61904 [28:47<6:48:16,  1.35s/it] 71%|███████   | 43805/61904 [28:48<7:01:42,  1.40s/it] 71%|███████   | 43806/61904 [28:50<7:01:20,  1.40s/it] 71%|███████   | 43807/61904 [28:51<6:58:25,  1.39s/it] 71%|███████   | 43808/61904 [28:52<6:52:01,  1.37s/it] 71%|███████   | 43809/61904 [28:54<6:59:45,  1.39s/it] 71%|███████   | 43810/61904 [28:55<6:50:23,  1.36s/it] 71%|███████   | 43811/61904 [28:57<7:08:43,  1.42s/it] 71%|███████   | 43812/61904 [28:58<7:00:51,  1.40s/it] 71%|███████   | 43813/61904 [28:59<6:56:16,  1.38s/it] 71%|███████   | 43814/61904 [29:01<6:47:25,  1.35s/it] 71%|███████   | 43815/61904 [29:02<6:42:49,  1.34s/it] 71%|███████   | 43816/61904 [29:03<6:47:40,  1.35s/it] 71%|███████   | 43817/61904 [29:05<6:43:59,  1.34s/it] 71%|███████   | 43818/61904 [29:06<6:46:50,  1.35s/it] 71%|███████   | 43819/61904 [29:07<6:40:36,  1.33s/it] 71%|███████   | 43820/61904 [29:09<6:47:39,  1.35s/it]                                                       {'loss': 2.4812, 'learning_rate': 1.293076623881758e-07, 'epoch': 11.33}
 71%|███████   | 43820/61904 [29:09<6:47:39,  1.35s/it] 71%|███████   | 43821/61904 [29:10<6:45:38,  1.35s/it] 71%|███████   | 43822/61904 [29:12<6:59:01,  1.39s/it] 71%|███████   | 43823/61904 [29:13<6:57:44,  1.39s/it] 71%|███████   | 43824/61904 [29:14<7:02:15,  1.40s/it] 71%|███████   | 43825/61904 [29:16<7:13:02,  1.44s/it] 71%|███████   | 43826/61904 [29:17<6:53:55,  1.37s/it] 71%|███████   | 43827/61904 [29:19<6:58:38,  1.39s/it] 71%|███████   | 43828/61904 [29:20<7:05:23,  1.41s/it] 71%|███████   | 43829/61904 [29:21<7:03:59,  1.41s/it] 71%|███████   | 43830/61904 [29:23<6:58:15,  1.39s/it] 71%|███████   | 43831/61904 [29:24<6:57:48,  1.39s/it] 71%|███████   | 43832/61904 [29:26<7:02:19,  1.40s/it] 71%|███████   | 43833/61904 [29:27<7:00:52,  1.40s/it] 71%|███████   | 43834/61904 [29:29<7:15:29,  1.45s/it] 71%|███████   | 43835/61904 [29:30<7:19:47,  1.46s/it] 71%|███████   | 43836/61904 [29:31<7:14:52,  1.44s/it] 71%|███████   | 43837/61904 [29:33<7:12:21,  1.44s/it] 71%|███████   | 43838/61904 [29:34<7:05:25,  1.41s/it] 71%|███████   | 43839/61904 [29:36<7:00:57,  1.40s/it] 71%|███████   | 43840/61904 [29:37<6:57:34,  1.39s/it]                                                       {'loss': 2.4528, 'learning_rate': 1.2927524957863349e-07, 'epoch': 11.33}
 71%|███████   | 43840/61904 [29:37<6:57:34,  1.39s/it] 71%|███████   | 43841/61904 [29:38<6:48:20,  1.36s/it] 71%|███████   | 43842/61904 [29:40<7:19:33,  1.46s/it] 71%|███████   | 43843/61904 [29:41<7:30:13,  1.50s/it] 71%|███████   | 43844/61904 [29:43<7:21:30,  1.47s/it] 71%|███████   | 43845/61904 [29:44<7:08:59,  1.43s/it] 71%|███████   | 43846/61904 [29:46<7:00:43,  1.40s/it] 71%|███████   | 43847/61904 [29:47<7:11:15,  1.43s/it] 71%|███████   | 43848/61904 [29:48<7:06:41,  1.42s/it] 71%|███████   | 43849/61904 [29:50<7:05:58,  1.42s/it] 71%|███████   | 43850/61904 [29:51<6:58:24,  1.39s/it] 71%|███████   | 43851/61904 [29:52<6:41:21,  1.33s/it] 71%|███████   | 43852/61904 [29:54<6:52:04,  1.37s/it] 71%|███████   | 43853/61904 [29:55<6:49:37,  1.36s/it] 71%|███████   | 43854/61904 [29:56<6:43:23,  1.34s/it] 71%|███████   | 43855/61904 [29:58<6:54:58,  1.38s/it] 71%|███████   | 43856/61904 [29:59<6:45:41,  1.35s/it] 71%|███████   | 43857/61904 [30:01<7:03:45,  1.41s/it] 71%|███████   | 43858/61904 [30:02<6:51:01,  1.37s/it] 71%|███████   | 43859/61904 [30:04<7:09:20,  1.43s/it] 71%|███████   | 43860/61904 [30:05<7:12:28,  1.44s/it]                                                       {'loss': 2.494, 'learning_rate': 1.2924283676909112e-07, 'epoch': 11.34}
 71%|███████   | 43860/61904 [30:05<7:12:28,  1.44s/it] 71%|███████   | 43861/61904 [30:06<7:10:20,  1.43s/it] 71%|███████   | 43862/61904 [30:08<7:06:52,  1.42s/it] 71%|███████   | 43863/61904 [30:09<6:57:16,  1.39s/it] 71%|███████   | 43864/61904 [30:11<6:56:33,  1.39s/it] 71%|███████   | 43865/61904 [30:12<7:00:15,  1.40s/it] 71%|███████   | 43866/61904 [30:13<6:55:35,  1.38s/it] 71%|███████   | 43867/61904 [30:15<7:03:53,  1.41s/it] 71%|███████   | 43868/61904 [30:16<7:08:00,  1.42s/it] 71%|███████   | 43869/61904 [30:18<6:56:19,  1.39s/it] 71%|███████   | 43870/61904 [30:19<7:03:11,  1.41s/it] 71%|███████   | 43871/61904 [30:20<6:59:00,  1.39s/it] 71%|███████   | 43872/61904 [30:22<7:12:24,  1.44s/it] 71%|███████   | 43873/61904 [30:23<7:00:31,  1.40s/it] 71%|███████   | 43874/61904 [30:25<6:59:43,  1.40s/it] 71%|███████   | 43875/61904 [30:26<6:59:24,  1.40s/it] 71%|███████   | 43876/61904 [30:27<6:54:18,  1.38s/it] 71%|███████   | 43877/61904 [30:29<6:53:47,  1.38s/it] 71%|███████   | 43878/61904 [30:30<7:02:43,  1.41s/it] 71%|███████   | 43879/61904 [30:32<6:59:47,  1.40s/it] 71%|███████   | 43880/61904 [30:33<6:58:39,  1.39s/it]                                                       {'loss': 2.4795, 'learning_rate': 1.292104239595488e-07, 'epoch': 11.34}
 71%|███████   | 43880/61904 [30:33<6:58:39,  1.39s/it] 71%|███████   | 43881/61904 [30:34<7:00:31,  1.40s/it] 71%|███████   | 43882/61904 [30:36<7:01:04,  1.40s/it] 71%|███████   | 43883/61904 [30:37<6:58:28,  1.39s/it] 71%|███████   | 43884/61904 [30:39<6:59:08,  1.40s/it] 71%|███████   | 43885/61904 [30:40<6:55:53,  1.38s/it] 71%|███████   | 43886/61904 [30:41<6:50:34,  1.37s/it] 71%|███████   | 43887/61904 [30:43<6:56:27,  1.39s/it] 71%|███████   | 43888/61904 [30:44<7:02:05,  1.41s/it] 71%|███████   | 43889/61904 [30:46<6:59:35,  1.40s/it] 71%|███████   | 43890/61904 [30:47<7:11:07,  1.44s/it] 71%|███████   | 43891/61904 [30:49<7:14:31,  1.45s/it] 71%|███████   | 43892/61904 [30:50<7:12:49,  1.44s/it] 71%|███████   | 43893/61904 [30:51<6:56:52,  1.39s/it] 71%|███████   | 43894/61904 [30:52<6:45:19,  1.35s/it] 71%|███████   | 43895/61904 [30:54<6:55:29,  1.38s/it] 71%|███████   | 43896/61904 [30:55<6:57:00,  1.39s/it] 71%|███████   | 43897/61904 [30:57<7:00:21,  1.40s/it] 71%|███████   | 43898/61904 [30:58<7:10:14,  1.43s/it] 71%|███████   | 43899/61904 [31:00<7:02:00,  1.41s/it] 71%|███████   | 43900/61904 [31:01<6:57:21,  1.39s/it]                                                       {'loss': 2.4816, 'learning_rate': 1.2917801115000647e-07, 'epoch': 11.35}
 71%|███████   | 43900/61904 [31:01<6:57:21,  1.39s/it] 71%|███████   | 43901/61904 [31:02<6:56:50,  1.39s/it] 71%|███████   | 43902/61904 [31:04<6:47:38,  1.36s/it] 71%|███████   | 43903/61904 [31:05<6:48:28,  1.36s/it] 71%|███████   | 43904/61904 [31:06<6:38:07,  1.33s/it] 71%|███████   | 43905/61904 [31:08<6:32:12,  1.31s/it] 71%|███████   | 43906/61904 [31:09<6:35:47,  1.32s/it] 71%|███████   | 43907/61904 [31:10<6:38:41,  1.33s/it] 71%|███████   | 43908/61904 [31:12<6:44:32,  1.35s/it] 71%|███████   | 43909/61904 [31:13<6:45:06,  1.35s/it] 71%|███████   | 43910/61904 [31:14<6:58:59,  1.40s/it] 71%|███████   | 43911/61904 [31:16<6:51:23,  1.37s/it] 71%|███████   | 43912/61904 [31:17<6:49:01,  1.36s/it] 71%|███████   | 43913/61904 [31:18<6:38:29,  1.33s/it] 71%|███████   | 43914/61904 [31:20<6:40:45,  1.34s/it] 71%|███████   | 43915/61904 [31:21<6:54:06,  1.38s/it] 71%|███████   | 43916/61904 [31:23<7:02:49,  1.41s/it] 71%|███████   | 43917/61904 [31:24<6:57:09,  1.39s/it] 71%|███████   | 43918/61904 [31:26<7:08:16,  1.43s/it] 71%|███████   | 43919/61904 [31:27<7:02:12,  1.41s/it] 71%|███████   | 43920/61904 [31:28<7:02:10,  1.41s/it]                                                       {'loss': 2.5282, 'learning_rate': 1.2914559834046413e-07, 'epoch': 11.35}
 71%|███████   | 43920/61904 [31:28<7:02:10,  1.41s/it] 71%|███████   | 43921/61904 [31:30<6:55:53,  1.39s/it] 71%|███████   | 43922/61904 [31:31<6:59:37,  1.40s/it] 71%|███████   | 43923/61904 [31:32<6:53:05,  1.38s/it] 71%|███████   | 43924/61904 [31:34<6:48:18,  1.36s/it] 71%|███████   | 43925/61904 [31:35<6:53:38,  1.38s/it] 71%|███████   | 43926/61904 [31:37<6:54:11,  1.38s/it] 71%|███████   | 43927/61904 [31:38<6:50:25,  1.37s/it] 71%|███████   | 43928/61904 [31:39<6:50:01,  1.37s/it] 71%|███████   | 43929/61904 [31:41<6:48:13,  1.36s/it] 71%|███████   | 43930/61904 [31:42<6:57:28,  1.39s/it] 71%|███████   | 43931/61904 [31:43<6:55:56,  1.39s/it] 71%|███████   | 43932/61904 [31:45<6:56:31,  1.39s/it] 71%|███████   | 43933/61904 [31:46<6:52:12,  1.38s/it] 71%|███████   | 43934/61904 [31:48<6:56:04,  1.39s/it] 71%|███████   | 43935/61904 [31:49<6:59:22,  1.40s/it] 71%|███████   | 43936/61904 [31:50<6:56:58,  1.39s/it] 71%|███████   | 43937/61904 [31:52<6:53:02,  1.38s/it] 71%|███████   | 43938/61904 [31:53<6:39:24,  1.33s/it] 71%|███████   | 43939/61904 [31:54<6:47:18,  1.36s/it] 71%|███████   | 43940/61904 [31:56<6:59:02,  1.40s/it]                                                       {'loss': 2.4849, 'learning_rate': 1.2911318553092182e-07, 'epoch': 11.36}
 71%|███████   | 43940/61904 [31:56<6:59:02,  1.40s/it] 71%|███████   | 43941/61904 [31:57<6:47:35,  1.36s/it] 71%|███████   | 43942/61904 [31:59<6:59:54,  1.40s/it] 71%|███████   | 43943/61904 [32:00<6:47:43,  1.36s/it] 71%|███████   | 43944/61904 [32:01<6:45:28,  1.35s/it] 71%|███████   | 43945/61904 [32:03<6:37:10,  1.33s/it] 71%|███████   | 43946/61904 [32:04<6:36:16,  1.32s/it] 71%|███████   | 43947/61904 [32:05<6:49:21,  1.37s/it] 71%|███████   | 43948/61904 [32:07<6:49:15,  1.37s/it] 71%|███████   | 43949/61904 [32:08<6:42:50,  1.35s/it] 71%|███████   | 43950/61904 [32:09<6:33:54,  1.32s/it] 71%|███████   | 43951/61904 [32:11<6:47:12,  1.36s/it] 71%|███████   | 43952/61904 [32:12<6:43:29,  1.35s/it] 71%|███████   | 43953/61904 [32:13<6:45:28,  1.36s/it] 71%|███████   | 43954/61904 [32:15<6:51:05,  1.37s/it] 71%|███████   | 43955/61904 [32:16<6:40:21,  1.34s/it] 71%|███████   | 43956/61904 [32:18<6:56:12,  1.39s/it] 71%|███████   | 43957/61904 [32:19<6:57:55,  1.40s/it] 71%|███████   | 43958/61904 [32:20<6:57:17,  1.40s/it] 71%|███████   | 43959/61904 [32:22<6:58:01,  1.40s/it] 71%|███████   | 43960/61904 [32:23<6:52:01,  1.38s/it]                                                       {'loss': 2.4246, 'learning_rate': 1.2908077272137948e-07, 'epoch': 11.36}
 71%|███████   | 43960/61904 [32:23<6:52:01,  1.38s/it] 71%|███████   | 43961/61904 [32:24<6:47:49,  1.36s/it] 71%|███████   | 43962/61904 [32:26<6:43:22,  1.35s/it] 71%|███████   | 43963/61904 [32:27<6:47:32,  1.36s/it] 71%|███████   | 43964/61904 [32:29<6:55:11,  1.39s/it] 71%|███████   | 43965/61904 [32:30<6:53:19,  1.38s/it] 71%|███████   | 43966/61904 [32:31<6:53:47,  1.38s/it] 71%|███████   | 43967/61904 [32:33<6:52:25,  1.38s/it] 71%|███████   | 43968/61904 [32:34<6:46:01,  1.36s/it] 71%|███████   | 43969/61904 [32:35<6:48:34,  1.37s/it] 71%|███████   | 43970/61904 [32:37<6:53:32,  1.38s/it] 71%|███████   | 43971/61904 [32:38<6:54:37,  1.39s/it] 71%|███████   | 43972/61904 [32:40<6:57:13,  1.40s/it] 71%|███████   | 43973/61904 [32:41<7:06:03,  1.43s/it] 71%|███████   | 43974/61904 [32:42<6:47:59,  1.37s/it] 71%|███████   | 43975/61904 [32:44<6:52:38,  1.38s/it] 71%|███████   | 43976/61904 [32:45<6:46:14,  1.36s/it] 71%|███████   | 43977/61904 [32:46<6:35:44,  1.32s/it] 71%|███████   | 43978/61904 [32:48<6:36:45,  1.33s/it] 71%|███████   | 43979/61904 [32:49<6:33:45,  1.32s/it] 71%|███████   | 43980/61904 [32:50<6:39:12,  1.34s/it]                                                       {'loss': 2.5491, 'learning_rate': 1.2904835991183715e-07, 'epoch': 11.37}
 71%|███████   | 43980/61904 [32:50<6:39:12,  1.34s/it] 71%|███████   | 43981/61904 [32:52<6:46:52,  1.36s/it] 71%|███████   | 43982/61904 [32:53<6:53:42,  1.39s/it] 71%|███████   | 43983/61904 [32:55<6:56:59,  1.40s/it] 71%|███████   | 43984/61904 [32:56<6:53:16,  1.38s/it] 71%|███████   | 43985/61904 [32:57<6:53:15,  1.38s/it] 71%|███████   | 43986/61904 [32:59<6:46:21,  1.36s/it] 71%|███████   | 43987/61904 [33:00<6:47:15,  1.36s/it] 71%|███████   | 43988/61904 [33:01<6:46:10,  1.36s/it] 71%|███████   | 43989/61904 [33:03<6:45:37,  1.36s/it] 71%|███████   | 43990/61904 [33:04<6:53:45,  1.39s/it] 71%|███████   | 43991/61904 [33:05<6:38:52,  1.34s/it] 71%|███████   | 43992/61904 [33:07<6:49:19,  1.37s/it] 71%|███████   | 43993/61904 [33:08<6:43:40,  1.35s/it] 71%|███████   | 43994/61904 [33:10<7:02:09,  1.41s/it] 71%|███████   | 43995/61904 [33:11<6:48:05,  1.37s/it] 71%|███████   | 43996/61904 [33:13<7:04:20,  1.42s/it] 71%|███████   | 43997/61904 [33:14<7:03:41,  1.42s/it] 71%|███████   | 43998/61904 [33:15<6:58:41,  1.40s/it] 71%|███████   | 43999/61904 [33:17<6:48:57,  1.37s/it] 71%|███████   | 44000/61904 [33:18<6:58:26,  1.40s/it]                                                       {'loss': 2.4584, 'learning_rate': 1.2901594710229483e-07, 'epoch': 11.37}
 71%|███████   | 44000/61904 [33:18<6:58:26,  1.40s/it] 71%|███████   | 44001/61904 [33:20<7:01:36,  1.41s/it] 71%|███████   | 44002/61904 [33:21<7:12:08,  1.45s/it] 71%|███████   | 44003/61904 [33:22<7:05:07,  1.42s/it] 71%|███████   | 44004/61904 [33:24<6:54:37,  1.39s/it] 71%|███████   | 44005/61904 [33:25<6:49:56,  1.37s/it] 71%|███████   | 44006/61904 [33:27<7:05:40,  1.43s/it] 71%|███████   | 44007/61904 [33:28<6:57:35,  1.40s/it] 71%|███████   | 44008/61904 [33:29<6:53:16,  1.39s/it] 71%|███████   | 44009/61904 [33:31<6:39:06,  1.34s/it] 71%|███████   | 44010/61904 [33:32<6:48:32,  1.37s/it] 71%|███████   | 44011/61904 [33:33<6:41:29,  1.35s/it] 71%|███████   | 44012/61904 [33:35<6:59:04,  1.41s/it] 71%|███████   | 44013/61904 [33:36<7:00:09,  1.41s/it] 71%|███████   | 44014/61904 [33:38<6:50:52,  1.38s/it] 71%|███████   | 44015/61904 [33:39<6:40:00,  1.34s/it] 71%|███████   | 44016/61904 [33:40<6:39:35,  1.34s/it] 71%|███████   | 44017/61904 [33:42<6:52:32,  1.38s/it] 71%|███████   | 44018/61904 [33:43<6:49:50,  1.37s/it] 71%|███████   | 44019/61904 [33:44<6:48:25,  1.37s/it] 71%|███████   | 44020/61904 [33:46<6:51:00,  1.38s/it]                                                       {'loss': 2.5351, 'learning_rate': 1.289835342927525e-07, 'epoch': 11.38}
 71%|███████   | 44020/61904 [33:46<6:51:00,  1.38s/it] 71%|███████   | 44021/61904 [33:47<6:49:04,  1.37s/it] 71%|███████   | 44022/61904 [33:48<6:43:28,  1.35s/it] 71%|███████   | 44023/61904 [33:50<6:34:40,  1.32s/it] 71%|███████   | 44024/61904 [33:51<6:33:52,  1.32s/it] 71%|███████   | 44025/61904 [33:52<6:39:28,  1.34s/it] 71%|███████   | 44026/61904 [33:54<6:51:16,  1.38s/it] 71%|███████   | 44027/61904 [33:55<6:47:03,  1.37s/it] 71%|███████   | 44028/61904 [33:57<6:42:22,  1.35s/it] 71%|███████   | 44029/61904 [33:58<6:37:42,  1.33s/it] 71%|███████   | 44030/61904 [33:59<6:35:18,  1.33s/it] 71%|███████   | 44031/61904 [34:01<6:45:24,  1.36s/it] 71%|███████   | 44032/61904 [34:02<6:39:23,  1.34s/it] 71%|███████   | 44033/61904 [34:03<6:39:49,  1.34s/it] 71%|███████   | 44034/61904 [34:05<6:48:38,  1.37s/it] 71%|███████   | 44035/61904 [34:06<6:50:49,  1.38s/it] 71%|███████   | 44036/61904 [34:07<6:42:46,  1.35s/it] 71%|███████   | 44037/61904 [34:09<6:38:58,  1.34s/it] 71%|███████   | 44038/61904 [34:10<6:31:40,  1.32s/it] 71%|███████   | 44039/61904 [34:11<6:27:11,  1.30s/it] 71%|███████   | 44040/61904 [34:13<6:54:53,  1.39s/it]                                                       {'loss': 2.5108, 'learning_rate': 1.2895112148321016e-07, 'epoch': 11.38}
 71%|███████   | 44040/61904 [34:13<6:54:53,  1.39s/it] 71%|███████   | 44041/61904 [34:14<6:48:15,  1.37s/it] 71%|███████   | 44042/61904 [34:15<6:48:26,  1.37s/it] 71%|███████   | 44043/61904 [34:17<6:43:25,  1.36s/it] 71%|███████   | 44044/61904 [34:18<6:51:53,  1.38s/it] 71%|███████   | 44045/61904 [34:20<6:44:11,  1.36s/it] 71%|███████   | 44046/61904 [34:21<6:40:37,  1.35s/it] 71%|███████   | 44047/61904 [34:22<6:38:34,  1.34s/it] 71%|███████   | 44048/61904 [34:24<6:38:25,  1.34s/it] 71%|███████   | 44049/61904 [34:25<7:01:08,  1.42s/it] 71%|███████   | 44050/61904 [34:26<6:53:09,  1.39s/it] 71%|███████   | 44051/61904 [34:28<6:48:37,  1.37s/it] 71%|███████   | 44052/61904 [34:29<6:48:48,  1.37s/it] 71%|███████   | 44053/61904 [34:30<6:45:49,  1.36s/it] 71%|███████   | 44054/61904 [34:32<6:49:34,  1.38s/it] 71%|███████   | 44055/61904 [34:33<6:59:42,  1.41s/it] 71%|███████   | 44056/61904 [34:35<6:53:44,  1.39s/it] 71%|███████   | 44057/61904 [34:36<6:44:32,  1.36s/it] 71%|███████   | 44058/61904 [34:37<6:47:52,  1.37s/it] 71%|███████   | 44059/61904 [34:39<6:46:28,  1.37s/it] 71%|███████   | 44060/61904 [34:40<6:43:08,  1.36s/it]                                                       {'loss': 2.5328, 'learning_rate': 1.2891870867366782e-07, 'epoch': 11.39}
 71%|███████   | 44060/61904 [34:40<6:43:08,  1.36s/it] 71%|███████   | 44061/61904 [34:41<6:44:56,  1.36s/it] 71%|███████   | 44062/61904 [34:43<6:47:06,  1.37s/it] 71%|███████   | 44063/61904 [34:44<6:54:52,  1.40s/it] 71%|███████   | 44064/61904 [34:46<6:48:10,  1.37s/it] 71%|███████   | 44065/61904 [34:47<6:42:09,  1.35s/it] 71%|███████   | 44066/61904 [34:48<6:43:06,  1.36s/it] 71%|███████   | 44067/61904 [34:50<6:32:06,  1.32s/it] 71%|███████   | 44068/61904 [34:51<6:33:38,  1.32s/it] 71%|███████   | 44069/61904 [34:52<6:23:44,  1.29s/it] 71%|███████   | 44070/61904 [34:54<6:37:24,  1.34s/it] 71%|███████   | 44071/61904 [34:55<6:44:22,  1.36s/it] 71%|███████   | 44072/61904 [34:56<6:48:38,  1.37s/it] 71%|███████   | 44073/61904 [34:58<6:52:19,  1.39s/it] 71%|███████   | 44074/61904 [34:59<6:48:04,  1.37s/it] 71%|███████   | 44075/61904 [35:00<6:48:56,  1.38s/it] 71%|███████   | 44076/61904 [35:02<6:43:38,  1.36s/it] 71%|███████   | 44077/61904 [35:03<6:51:20,  1.38s/it] 71%|███████   | 44078/61904 [35:05<6:40:52,  1.35s/it] 71%|███████   | 44079/61904 [35:06<6:58:36,  1.41s/it] 71%|███████   | 44080/61904 [35:07<6:50:20,  1.38s/it]                                                       {'loss': 2.4501, 'learning_rate': 1.2888629586412548e-07, 'epoch': 11.39}
 71%|███████   | 44080/61904 [35:07<6:50:20,  1.38s/it] 71%|███████   | 44081/61904 [35:09<7:01:45,  1.42s/it] 71%|███████   | 44082/61904 [35:10<6:57:05,  1.40s/it] 71%|███████   | 44083/61904 [35:12<7:05:19,  1.43s/it] 71%|███████   | 44084/61904 [35:13<7:14:19,  1.46s/it] 71%|███████   | 44085/61904 [35:15<7:04:19,  1.43s/it] 71%|███████   | 44086/61904 [35:16<6:58:37,  1.41s/it] 71%|███████   | 44087/61904 [35:17<6:51:24,  1.39s/it] 71%|███████   | 44088/61904 [35:19<6:50:17,  1.38s/it] 71%|███████   | 44089/61904 [35:20<6:48:48,  1.38s/it] 71%|███████   | 44090/61904 [35:21<6:33:48,  1.33s/it] 71%|███████   | 44091/61904 [35:23<6:35:01,  1.33s/it] 71%|███████   | 44092/61904 [35:24<6:40:03,  1.35s/it] 71%|███████   | 44093/61904 [35:25<6:38:13,  1.34s/it] 71%|███████   | 44094/61904 [35:27<6:56:56,  1.40s/it] 71%|███████   | 44095/61904 [35:28<6:50:46,  1.38s/it] 71%|███████   | 44096/61904 [35:29<6:39:33,  1.35s/it] 71%|███████   | 44097/61904 [35:31<6:38:26,  1.34s/it] 71%|███████   | 44098/61904 [35:32<6:30:36,  1.32s/it] 71%|███████   | 44099/61904 [35:34<6:48:50,  1.38s/it] 71%|███████   | 44100/61904 [35:35<6:52:33,  1.39s/it]                                                       {'loss': 2.434, 'learning_rate': 1.2885388305458317e-07, 'epoch': 11.4}
 71%|███████   | 44100/61904 [35:35<6:52:33,  1.39s/it] 71%|███████   | 44101/61904 [35:36<6:40:20,  1.35s/it] 71%|███████   | 44102/61904 [35:38<6:50:30,  1.38s/it] 71%|███████   | 44103/61904 [35:39<6:52:43,  1.39s/it] 71%|███████   | 44104/61904 [35:40<6:43:51,  1.36s/it] 71%|███████   | 44105/61904 [35:42<6:37:32,  1.34s/it] 71%|███████   | 44106/61904 [35:43<6:51:36,  1.39s/it] 71%|███████▏  | 44107/61904 [35:45<6:56:27,  1.40s/it] 71%|███████▏  | 44108/61904 [35:46<6:42:52,  1.36s/it] 71%|███████▏  | 44109/61904 [35:47<6:43:52,  1.36s/it] 71%|███████▏  | 44110/61904 [35:49<6:35:00,  1.33s/it] 71%|███████▏  | 44111/61904 [35:50<6:30:25,  1.32s/it] 71%|███████▏  | 44112/61904 [35:51<6:27:39,  1.31s/it] 71%|███████▏  | 44113/61904 [35:52<6:26:04,  1.30s/it] 71%|███████▏  | 44114/61904 [35:54<6:32:10,  1.32s/it] 71%|███████▏  | 44115/61904 [35:55<6:24:25,  1.30s/it] 71%|███████▏  | 44116/61904 [35:57<6:49:54,  1.38s/it] 71%|███████▏  | 44117/61904 [35:58<6:34:20,  1.33s/it] 71%|███████▏  | 44118/61904 [35:59<6:37:43,  1.34s/it] 71%|███████▏  | 44119/61904 [36:00<6:34:18,  1.33s/it] 71%|███████▏  | 44120/61904 [36:02<6:40:21,  1.35s/it]                                                       {'loss': 2.4713, 'learning_rate': 1.2882147024504083e-07, 'epoch': 11.4}
 71%|███████▏  | 44120/61904 [36:02<6:40:21,  1.35s/it] 71%|███████▏  | 44121/61904 [36:03<6:44:07,  1.36s/it] 71%|███████▏  | 44122/61904 [36:04<6:32:29,  1.32s/it] 71%|███████▏  | 44123/61904 [36:06<6:32:35,  1.32s/it] 71%|███████▏  | 44124/61904 [36:07<6:40:18,  1.35s/it] 71%|███████▏  | 44125/61904 [36:09<6:43:40,  1.36s/it] 71%|███████▏  | 44126/61904 [36:10<6:45:22,  1.37s/it] 71%|███████▏  | 44127/61904 [36:11<6:35:21,  1.33s/it] 71%|███████▏  | 44128/61904 [36:13<6:50:09,  1.38s/it] 71%|███████▏  | 44129/61904 [36:14<6:58:15,  1.41s/it] 71%|███████▏  | 44130/61904 [36:16<6:46:56,  1.37s/it] 71%|███████▏  | 44131/61904 [36:17<6:47:50,  1.38s/it] 71%|███████▏  | 44132/61904 [36:18<6:41:55,  1.36s/it] 71%|███████▏  | 44133/61904 [36:20<6:46:21,  1.37s/it] 71%|███████▏  | 44134/61904 [36:21<7:01:58,  1.42s/it] 71%|███████▏  | 44135/61904 [36:23<7:01:57,  1.42s/it] 71%|███████▏  | 44136/61904 [36:24<7:04:54,  1.43s/it] 71%|███████▏  | 44137/61904 [36:25<6:50:04,  1.38s/it] 71%|███████▏  | 44138/61904 [36:27<6:52:49,  1.39s/it] 71%|███████▏  | 44139/61904 [36:28<7:02:52,  1.43s/it] 71%|███████▏  | 44140/61904 [36:30<7:11:23,  1.46s/it]                                                       {'loss': 2.5093, 'learning_rate': 1.287890574354985e-07, 'epoch': 11.41}
 71%|███████▏  | 44140/61904 [36:30<7:11:23,  1.46s/it] 71%|███████▏  | 44141/61904 [36:31<7:14:24,  1.47s/it] 71%|███████▏  | 44142/61904 [36:33<7:01:48,  1.42s/it] 71%|███████▏  | 44143/61904 [36:34<6:54:47,  1.40s/it] 71%|███████▏  | 44144/61904 [36:35<7:02:48,  1.43s/it] 71%|███████▏  | 44145/61904 [36:37<6:56:37,  1.41s/it] 71%|███████▏  | 44146/61904 [36:38<6:50:21,  1.39s/it] 71%|███████▏  | 44147/61904 [36:39<6:41:35,  1.36s/it] 71%|███████▏  | 44148/61904 [36:41<6:43:54,  1.36s/it] 71%|███████▏  | 44149/61904 [36:42<6:43:18,  1.36s/it] 71%|███████▏  | 44150/61904 [36:44<6:46:22,  1.37s/it] 71%|███████▏  | 44151/61904 [36:45<6:37:04,  1.34s/it] 71%|███████▏  | 44152/61904 [36:46<6:31:14,  1.32s/it] 71%|███████▏  | 44153/61904 [36:47<6:38:30,  1.35s/it] 71%|███████▏  | 44154/61904 [36:49<6:29:38,  1.32s/it] 71%|███████▏  | 44155/61904 [36:50<6:50:07,  1.39s/it] 71%|███████▏  | 44156/61904 [36:52<6:53:47,  1.40s/it] 71%|███████▏  | 44157/61904 [36:53<6:55:46,  1.41s/it] 71%|███████▏  | 44158/61904 [36:54<6:50:27,  1.39s/it] 71%|███████▏  | 44159/61904 [36:56<7:01:07,  1.42s/it] 71%|███████▏  | 44160/61904 [36:57<6:55:13,  1.40s/it]                                                       {'loss': 2.5031, 'learning_rate': 1.2875664462595618e-07, 'epoch': 11.41}
 71%|███████▏  | 44160/61904 [36:57<6:55:13,  1.40s/it] 71%|███████▏  | 44161/61904 [36:59<6:44:09,  1.37s/it] 71%|███████▏  | 44162/61904 [37:00<6:36:10,  1.34s/it] 71%|███████▏  | 44163/61904 [37:01<6:26:59,  1.31s/it] 71%|███████▏  | 44164/61904 [37:03<6:41:31,  1.36s/it] 71%|███████▏  | 44165/61904 [37:04<6:39:17,  1.35s/it] 71%|███████▏  | 44166/61904 [37:05<6:33:29,  1.33s/it] 71%|███████▏  | 44167/61904 [37:07<6:41:26,  1.36s/it] 71%|███████▏  | 44168/61904 [37:08<6:46:51,  1.38s/it] 71%|███████▏  | 44169/61904 [37:09<6:47:00,  1.38s/it] 71%|███████▏  | 44170/61904 [37:11<6:45:27,  1.37s/it] 71%|███████▏  | 44171/61904 [37:12<6:56:04,  1.41s/it] 71%|███████▏  | 44172/61904 [37:14<6:42:14,  1.36s/it] 71%|███████▏  | 44173/61904 [37:15<6:34:09,  1.33s/it] 71%|███████▏  | 44174/61904 [37:16<6:32:01,  1.33s/it] 71%|███████▏  | 44175/61904 [37:17<6:29:22,  1.32s/it] 71%|███████▏  | 44176/61904 [37:19<6:43:48,  1.37s/it] 71%|███████▏  | 44177/61904 [37:20<6:41:46,  1.36s/it] 71%|███████▏  | 44178/61904 [37:22<6:50:09,  1.39s/it] 71%|███████▏  | 44179/61904 [37:23<6:58:58,  1.42s/it] 71%|███████▏  | 44180/61904 [37:25<6:48:48,  1.38s/it]                                                       {'loss': 2.4712, 'learning_rate': 1.2872423181641384e-07, 'epoch': 11.42}
 71%|███████▏  | 44180/61904 [37:25<6:48:48,  1.38s/it] 71%|███████▏  | 44181/61904 [37:26<7:00:54,  1.42s/it] 71%|███████▏  | 44182/61904 [37:27<6:47:38,  1.38s/it] 71%|███████▏  | 44183/61904 [37:29<6:36:40,  1.34s/it] 71%|███████▏  | 44184/61904 [37:30<6:47:50,  1.38s/it] 71%|███████▏  | 44185/61904 [37:32<7:01:00,  1.43s/it] 71%|███████▏  | 44186/61904 [37:33<7:29:44,  1.52s/it] 71%|███████▏  | 44187/61904 [37:35<7:19:11,  1.49s/it] 71%|███████▏  | 44188/61904 [37:36<7:02:50,  1.43s/it] 71%|███████▏  | 44189/61904 [37:37<6:53:01,  1.40s/it] 71%|███████▏  | 44190/61904 [37:39<6:51:20,  1.39s/it] 71%|███████▏  | 44191/61904 [37:40<6:46:26,  1.38s/it] 71%|███████▏  | 44192/61904 [37:42<6:55:38,  1.41s/it] 71%|███████▏  | 44193/61904 [37:43<6:52:13,  1.40s/it] 71%|███████▏  | 44194/61904 [37:44<6:51:08,  1.39s/it] 71%|███████▏  | 44195/61904 [37:46<6:41:53,  1.36s/it] 71%|███████▏  | 44196/61904 [37:47<7:06:23,  1.44s/it] 71%|███████▏  | 44197/61904 [37:48<6:49:13,  1.39s/it] 71%|███████▏  | 44198/61904 [37:50<6:47:03,  1.38s/it] 71%|███████▏  | 44199/61904 [37:51<6:47:51,  1.38s/it] 71%|███████▏  | 44200/61904 [37:53<6:43:55,  1.37s/it]                                                       {'loss': 2.4963, 'learning_rate': 1.286918190068715e-07, 'epoch': 11.42}
 71%|███████▏  | 44200/61904 [37:53<6:43:55,  1.37s/it] 71%|███████▏  | 44201/61904 [37:54<6:45:15,  1.37s/it] 71%|███████▏  | 44202/61904 [37:55<6:50:29,  1.39s/it] 71%|███████▏  | 44203/61904 [37:57<6:47:12,  1.38s/it] 71%|███████▏  | 44204/61904 [37:58<6:39:23,  1.35s/it] 71%|███████▏  | 44205/61904 [38:00<7:05:18,  1.44s/it] 71%|███████▏  | 44206/61904 [38:01<6:56:48,  1.41s/it] 71%|███████▏  | 44207/61904 [38:02<6:51:28,  1.40s/it] 71%|███████▏  | 44208/61904 [38:04<6:53:05,  1.40s/it] 71%|███████▏  | 44209/61904 [38:05<7:14:11,  1.47s/it] 71%|███████▏  | 44210/61904 [38:07<7:03:20,  1.44s/it] 71%|███████▏  | 44211/61904 [38:08<6:52:17,  1.40s/it] 71%|███████▏  | 44212/61904 [38:09<6:37:38,  1.35s/it] 71%|███████▏  | 44213/61904 [38:11<6:42:21,  1.36s/it] 71%|███████▏  | 44214/61904 [38:12<6:31:04,  1.33s/it] 71%|███████▏  | 44215/61904 [38:13<6:23:17,  1.30s/it] 71%|███████▏  | 44216/61904 [38:15<6:28:16,  1.32s/it] 71%|███████▏  | 44217/61904 [38:16<6:43:46,  1.37s/it] 71%|███████▏  | 44218/61904 [38:17<6:35:28,  1.34s/it] 71%|███████▏  | 44219/61904 [38:19<6:53:53,  1.40s/it] 71%|███████▏  | 44220/61904 [38:20<6:57:40,  1.42s/it]                                                       {'loss': 2.4866, 'learning_rate': 1.2865940619732917e-07, 'epoch': 11.43}
 71%|███████▏  | 44220/61904 [38:20<6:57:40,  1.42s/it] 71%|███████▏  | 44221/61904 [38:22<6:52:50,  1.40s/it] 71%|███████▏  | 44222/61904 [38:23<6:55:06,  1.41s/it] 71%|███████▏  | 44223/61904 [38:25<6:57:29,  1.42s/it] 71%|███████▏  | 44224/61904 [38:26<6:55:01,  1.41s/it] 71%|███████▏  | 44225/61904 [38:27<6:50:33,  1.39s/it] 71%|███████▏  | 44226/61904 [38:29<6:58:00,  1.42s/it] 71%|███████▏  | 44227/61904 [38:30<6:49:38,  1.39s/it] 71%|███████▏  | 44228/61904 [38:31<6:37:56,  1.35s/it] 71%|███████▏  | 44229/61904 [38:33<6:43:46,  1.37s/it] 71%|███████▏  | 44230/61904 [38:34<6:42:13,  1.37s/it] 71%|███████▏  | 44231/61904 [38:35<6:35:08,  1.34s/it] 71%|███████▏  | 44232/61904 [38:37<6:40:22,  1.36s/it] 71%|███████▏  | 44233/61904 [38:38<6:54:57,  1.41s/it] 71%|███████▏  | 44234/61904 [38:40<6:46:06,  1.38s/it] 71%|███████▏  | 44235/61904 [38:41<6:40:28,  1.36s/it] 71%|███████▏  | 44236/61904 [38:42<6:40:06,  1.36s/it] 71%|███████▏  | 44237/61904 [38:44<6:48:05,  1.39s/it] 71%|███████▏  | 44238/61904 [38:45<6:38:43,  1.35s/it] 71%|███████▏  | 44239/61904 [38:46<6:25:42,  1.31s/it] 71%|███████▏  | 44240/61904 [38:48<6:53:18,  1.40s/it]                                                       {'loss': 2.4665, 'learning_rate': 1.2862699338778686e-07, 'epoch': 11.43}
 71%|███████▏  | 44240/61904 [38:48<6:53:18,  1.40s/it] 71%|███████▏  | 44241/61904 [38:49<6:39:45,  1.36s/it] 71%|███████▏  | 44242/61904 [38:51<6:42:38,  1.37s/it] 71%|███████▏  | 44243/61904 [38:52<6:51:31,  1.40s/it] 71%|███████▏  | 44244/61904 [38:54<7:05:00,  1.44s/it] 71%|███████▏  | 44245/61904 [38:55<7:18:31,  1.49s/it] 71%|███████▏  | 44246/61904 [38:56<7:03:58,  1.44s/it] 71%|███████▏  | 44247/61904 [38:58<7:01:27,  1.43s/it] 71%|███████▏  | 44248/61904 [38:59<7:00:36,  1.43s/it] 71%|███████▏  | 44249/61904 [39:01<6:52:41,  1.40s/it] 71%|███████▏  | 44250/61904 [39:02<6:45:55,  1.38s/it] 71%|███████▏  | 44251/61904 [39:03<6:55:52,  1.41s/it] 71%|███████▏  | 44252/61904 [39:05<6:57:23,  1.42s/it] 71%|███████▏  | 44253/61904 [39:06<6:50:38,  1.40s/it] 71%|███████▏  | 44254/61904 [39:08<6:58:25,  1.42s/it] 71%|███████▏  | 44255/61904 [39:09<6:48:46,  1.39s/it] 71%|███████▏  | 44256/61904 [39:10<6:39:50,  1.36s/it] 71%|███████▏  | 44257/61904 [39:12<6:32:10,  1.33s/it] 71%|███████▏  | 44258/61904 [39:13<6:44:13,  1.37s/it] 71%|███████▏  | 44259/61904 [39:15<6:51:53,  1.40s/it] 71%|███████▏  | 44260/61904 [39:16<6:42:38,  1.37s/it]                                                       {'loss': 2.4525, 'learning_rate': 1.2859458057824452e-07, 'epoch': 11.44}
 71%|███████▏  | 44260/61904 [39:16<6:42:38,  1.37s/it] 71%|███████▏  | 44261/61904 [39:17<6:38:31,  1.36s/it] 72%|███████▏  | 44262/61904 [39:18<6:29:14,  1.32s/it] 72%|███████▏  | 44263/61904 [39:20<6:38:10,  1.35s/it] 72%|███████▏  | 44264/61904 [39:21<6:49:27,  1.39s/it] 72%|███████▏  | 44265/61904 [39:23<6:41:17,  1.36s/it] 72%|███████▏  | 44266/61904 [39:24<6:31:11,  1.33s/it] 72%|███████▏  | 44267/61904 [39:25<6:30:50,  1.33s/it] 72%|███████▏  | 44268/61904 [39:27<6:42:15,  1.37s/it] 72%|███████▏  | 44269/61904 [39:28<6:47:21,  1.39s/it] 72%|███████▏  | 44270/61904 [39:29<6:49:09,  1.39s/it] 72%|███████▏  | 44271/61904 [39:31<6:45:25,  1.38s/it] 72%|███████▏  | 44272/61904 [39:32<7:02:26,  1.44s/it] 72%|███████▏  | 44273/61904 [39:34<6:45:40,  1.38s/it] 72%|███████▏  | 44274/61904 [39:35<6:47:19,  1.39s/it] 72%|███████▏  | 44275/61904 [39:36<6:41:10,  1.37s/it] 72%|███████▏  | 44276/61904 [39:38<6:31:30,  1.33s/it] 72%|███████▏  | 44277/61904 [39:39<6:45:18,  1.38s/it] 72%|███████▏  | 44278/61904 [39:40<6:42:41,  1.37s/it] 72%|███████▏  | 44279/61904 [39:42<6:44:01,  1.38s/it] 72%|███████▏  | 44280/61904 [39:43<6:33:30,  1.34s/it]                                                       {'loss': 2.5271, 'learning_rate': 1.2856216776870218e-07, 'epoch': 11.44}
 72%|███████▏  | 44280/61904 [39:43<6:33:30,  1.34s/it] 72%|███████▏  | 44281/61904 [39:44<6:36:48,  1.35s/it] 72%|███████▏  | 44282/61904 [39:46<6:40:29,  1.36s/it] 72%|███████▏  | 44283/61904 [39:47<6:23:06,  1.30s/it] 72%|███████▏  | 44284/61904 [39:48<6:21:58,  1.30s/it] 72%|███████▏  | 44285/61904 [39:50<6:26:41,  1.32s/it] 72%|███████▏  | 44286/61904 [39:51<6:32:35,  1.34s/it] 72%|███████▏  | 44287/61904 [39:52<6:30:41,  1.33s/it] 72%|███████▏  | 44288/61904 [39:54<6:40:13,  1.36s/it] 72%|███████▏  | 44289/61904 [39:55<6:33:29,  1.34s/it] 72%|███████▏  | 44290/61904 [39:56<6:31:48,  1.33s/it] 72%|███████▏  | 44291/61904 [39:58<6:31:10,  1.33s/it] 72%|███████▏  | 44292/61904 [39:59<6:40:07,  1.36s/it] 72%|███████▏  | 44293/61904 [40:00<6:35:38,  1.35s/it] 72%|███████▏  | 44294/61904 [40:02<6:38:30,  1.36s/it] 72%|███████▏  | 44295/61904 [40:03<6:47:13,  1.39s/it] 72%|███████▏  | 44296/61904 [40:05<6:48:01,  1.39s/it] 72%|███████▏  | 44297/61904 [40:06<6:34:14,  1.34s/it] 72%|███████▏  | 44298/61904 [40:07<6:38:19,  1.36s/it] 72%|███████▏  | 44299/61904 [40:09<6:48:11,  1.39s/it] 72%|███████▏  | 44300/61904 [40:10<6:43:18,  1.37s/it]                                                       {'loss': 2.4676, 'learning_rate': 1.2852975495915984e-07, 'epoch': 11.45}
 72%|███████▏  | 44300/61904 [40:10<6:43:18,  1.37s/it] 72%|███████▏  | 44301/61904 [40:12<6:46:30,  1.39s/it] 72%|███████▏  | 44302/61904 [40:13<6:47:51,  1.39s/it] 72%|███████▏  | 44303/61904 [40:15<7:01:44,  1.44s/it] 72%|███████▏  | 44304/61904 [40:16<6:46:16,  1.39s/it] 72%|███████▏  | 44305/61904 [40:17<6:43:54,  1.38s/it] 72%|███████▏  | 44306/61904 [40:18<6:41:18,  1.37s/it] 72%|███████▏  | 44307/61904 [40:20<6:51:53,  1.40s/it] 72%|███████▏  | 44308/61904 [40:21<6:41:51,  1.37s/it] 72%|███████▏  | 44309/61904 [40:23<6:42:05,  1.37s/it] 72%|███████▏  | 44310/61904 [40:24<6:36:44,  1.35s/it] 72%|███████▏  | 44311/61904 [40:25<6:39:29,  1.36s/it] 72%|███████▏  | 44312/61904 [40:27<6:36:14,  1.35s/it] 72%|███████▏  | 44313/61904 [40:28<6:40:08,  1.36s/it] 72%|███████▏  | 44314/61904 [40:29<6:36:28,  1.35s/it] 72%|███████▏  | 44315/61904 [40:31<6:24:11,  1.31s/it] 72%|███████▏  | 44316/61904 [40:32<6:18:41,  1.29s/it] 72%|███████▏  | 44317/61904 [40:33<6:40:48,  1.37s/it] 72%|███████▏  | 44318/61904 [40:35<6:30:53,  1.33s/it] 72%|███████▏  | 44319/61904 [40:36<6:29:56,  1.33s/it] 72%|███████▏  | 44320/61904 [40:37<6:32:44,  1.34s/it]                                                       {'loss': 2.4996, 'learning_rate': 1.2849734214961753e-07, 'epoch': 11.46}
 72%|███████▏  | 44320/61904 [40:37<6:32:44,  1.34s/it] 72%|███████▏  | 44321/61904 [40:39<6:35:33,  1.35s/it] 72%|███████▏  | 44322/61904 [40:40<6:34:17,  1.35s/it] 72%|███████▏  | 44323/61904 [40:41<6:31:16,  1.34s/it] 72%|███████▏  | 44324/61904 [40:43<6:36:58,  1.35s/it] 72%|███████▏  | 44325/61904 [40:44<6:26:10,  1.32s/it] 72%|███████▏  | 44326/61904 [40:45<6:39:28,  1.36s/it] 72%|███████▏  | 44327/61904 [40:47<6:40:56,  1.37s/it] 72%|███████▏  | 44328/61904 [40:48<6:37:52,  1.36s/it] 72%|███████▏  | 44329/61904 [40:50<6:43:38,  1.38s/it] 72%|███████▏  | 44330/61904 [40:51<6:38:02,  1.36s/it] 72%|███████▏  | 44331/61904 [40:52<6:38:25,  1.36s/it] 72%|███████▏  | 44332/61904 [40:54<6:31:24,  1.34s/it] 72%|███████▏  | 44333/61904 [40:55<6:43:34,  1.38s/it] 72%|███████▏  | 44334/61904 [40:56<6:35:28,  1.35s/it] 72%|███████▏  | 44335/61904 [40:58<6:35:46,  1.35s/it] 72%|███████▏  | 44336/61904 [40:59<6:36:27,  1.35s/it] 72%|███████▏  | 44337/61904 [41:00<6:29:57,  1.33s/it] 72%|███████▏  | 44338/61904 [41:02<6:30:41,  1.33s/it] 72%|███████▏  | 44339/61904 [41:03<6:35:42,  1.35s/it] 72%|███████▏  | 44340/61904 [41:04<6:33:16,  1.34s/it]                                                       {'loss': 2.4901, 'learning_rate': 1.284649293400752e-07, 'epoch': 11.46}
 72%|███████▏  | 44340/61904 [41:04<6:33:16,  1.34s/it] 72%|███████▏  | 44341/61904 [41:06<6:31:41,  1.34s/it] 72%|███████▏  | 44342/61904 [41:07<6:31:52,  1.34s/it] 72%|███████▏  | 44343/61904 [41:09<6:45:07,  1.38s/it] 72%|███████▏  | 44344/61904 [41:10<6:59:51,  1.43s/it] 72%|███████▏  | 44345/61904 [41:11<6:53:55,  1.41s/it] 72%|███████▏  | 44346/61904 [41:13<7:02:50,  1.44s/it] 72%|███████▏  | 44347/61904 [41:14<7:02:46,  1.44s/it] 72%|███████▏  | 44348/61904 [41:16<7:01:07,  1.44s/it] 72%|███████▏  | 44349/61904 [41:17<6:48:57,  1.40s/it] 72%|███████▏  | 44350/61904 [41:18<6:45:50,  1.39s/it] 72%|███████▏  | 44351/61904 [41:20<6:47:48,  1.39s/it] 72%|███████▏  | 44352/61904 [41:21<6:42:53,  1.38s/it] 72%|███████▏  | 44353/61904 [41:23<6:39:48,  1.37s/it] 72%|███████▏  | 44354/61904 [41:24<6:34:47,  1.35s/it] 72%|███████▏  | 44355/61904 [41:25<6:34:58,  1.35s/it] 72%|███████▏  | 44356/61904 [41:27<7:00:37,  1.44s/it] 72%|███████▏  | 44357/61904 [41:28<7:01:55,  1.44s/it] 72%|███████▏  | 44358/61904 [41:30<6:52:45,  1.41s/it] 72%|███████▏  | 44359/61904 [41:31<6:52:19,  1.41s/it] 72%|███████▏  | 44360/61904 [41:32<6:40:01,  1.37s/it]                                                       {'loss': 2.411, 'learning_rate': 1.2843251653053285e-07, 'epoch': 11.47}
 72%|███████▏  | 44360/61904 [41:32<6:40:01,  1.37s/it] 72%|███████▏  | 44361/61904 [41:34<6:42:17,  1.38s/it] 72%|███████▏  | 44362/61904 [41:35<6:42:44,  1.38s/it] 72%|███████▏  | 44363/61904 [41:37<6:52:09,  1.41s/it] 72%|███████▏  | 44364/61904 [41:38<6:39:24,  1.37s/it] 72%|███████▏  | 44365/61904 [41:39<6:39:03,  1.37s/it] 72%|███████▏  | 44366/61904 [41:41<6:31:57,  1.34s/it] 72%|███████▏  | 44367/61904 [41:42<6:38:03,  1.36s/it] 72%|███████▏  | 44368/61904 [41:43<6:41:36,  1.37s/it] 72%|███████▏  | 44369/61904 [41:45<6:38:41,  1.36s/it] 72%|███████▏  | 44370/61904 [41:46<6:44:44,  1.39s/it] 72%|███████▏  | 44371/61904 [41:47<6:31:08,  1.34s/it] 72%|███████▏  | 44372/61904 [41:49<6:33:02,  1.35s/it] 72%|███████▏  | 44373/61904 [41:50<6:43:05,  1.38s/it] 72%|███████▏  | 44374/61904 [41:51<6:33:55,  1.35s/it] 72%|███████▏  | 44375/61904 [41:53<6:30:07,  1.34s/it] 72%|███████▏  | 44376/61904 [41:54<6:33:14,  1.35s/it] 72%|███████▏  | 44377/61904 [41:56<6:45:10,  1.39s/it] 72%|███████▏  | 44378/61904 [41:57<6:54:27,  1.42s/it] 72%|███████▏  | 44379/61904 [41:58<6:49:36,  1.40s/it] 72%|███████▏  | 44380/61904 [42:00<6:41:23,  1.37s/it]                                                       {'loss': 2.4688, 'learning_rate': 1.2840010372099054e-07, 'epoch': 11.47}
 72%|███████▏  | 44380/61904 [42:00<6:41:23,  1.37s/it] 72%|███████▏  | 44381/61904 [42:01<6:42:14,  1.38s/it] 72%|███████▏  | 44382/61904 [42:03<7:02:26,  1.45s/it] 72%|███████▏  | 44383/61904 [42:04<7:02:35,  1.45s/it] 72%|███████▏  | 44384/61904 [42:06<7:02:44,  1.45s/it] 72%|███████▏  | 44385/61904 [42:07<6:54:12,  1.42s/it] 72%|███████▏  | 44386/61904 [42:08<6:36:42,  1.36s/it] 72%|███████▏  | 44387/61904 [42:10<6:53:14,  1.42s/it] 72%|███████▏  | 44388/61904 [42:11<6:45:01,  1.39s/it] 72%|███████▏  | 44389/61904 [42:12<6:37:19,  1.36s/it] 72%|███████▏  | 44390/61904 [42:14<6:35:02,  1.35s/it] 72%|███████▏  | 44391/61904 [42:15<6:47:26,  1.40s/it] 72%|███████▏  | 44392/61904 [42:17<6:48:20,  1.40s/it] 72%|███████▏  | 44393/61904 [42:18<6:38:01,  1.36s/it] 72%|███████▏  | 44394/61904 [42:19<6:37:01,  1.36s/it] 72%|███████▏  | 44395/61904 [42:21<6:35:43,  1.36s/it] 72%|███████▏  | 44396/61904 [42:22<6:27:58,  1.33s/it] 72%|███████▏  | 44397/61904 [42:23<6:37:46,  1.36s/it] 72%|███████▏  | 44398/61904 [42:25<6:33:50,  1.35s/it] 72%|███████▏  | 44399/61904 [42:26<6:50:07,  1.41s/it] 72%|███████▏  | 44400/61904 [42:28<6:44:54,  1.39s/it]                                                       {'loss': 2.4458, 'learning_rate': 1.283676909114482e-07, 'epoch': 11.48}
 72%|███████▏  | 44400/61904 [42:28<6:44:54,  1.39s/it] 72%|███████▏  | 44401/61904 [42:29<6:43:49,  1.38s/it] 72%|███████▏  | 44402/61904 [42:30<6:33:30,  1.35s/it] 72%|███████▏  | 44403/61904 [42:31<6:19:01,  1.30s/it] 72%|███████▏  | 44404/61904 [42:33<6:16:14,  1.29s/it] 72%|███████▏  | 44405/61904 [42:34<6:21:27,  1.31s/it] 72%|███████▏  | 44406/61904 [42:35<6:30:42,  1.34s/it] 72%|███████▏  | 44407/61904 [42:37<6:25:29,  1.32s/it] 72%|███████▏  | 44408/61904 [42:38<6:26:31,  1.33s/it] 72%|███████▏  | 44409/61904 [42:39<6:24:57,  1.32s/it] 72%|███████▏  | 44410/61904 [42:41<6:35:59,  1.36s/it] 72%|███████▏  | 44411/61904 [42:42<6:22:59,  1.31s/it] 72%|███████▏  | 44412/61904 [42:43<6:33:54,  1.35s/it] 72%|███████▏  | 44413/61904 [42:45<6:29:24,  1.34s/it] 72%|███████▏  | 44414/61904 [42:46<6:22:18,  1.31s/it] 72%|███████▏  | 44415/61904 [42:47<6:29:57,  1.34s/it] 72%|███████▏  | 44416/61904 [42:49<6:30:29,  1.34s/it] 72%|███████▏  | 44417/61904 [42:50<6:28:36,  1.33s/it] 72%|███████▏  | 44418/61904 [42:51<6:34:23,  1.35s/it] 72%|███████▏  | 44419/61904 [42:53<6:26:37,  1.33s/it] 72%|███████▏  | 44420/61904 [42:54<6:28:26,  1.33s/it]                                                       {'loss': 2.4871, 'learning_rate': 1.2833527810190587e-07, 'epoch': 11.48}
 72%|███████▏  | 44420/61904 [42:54<6:28:26,  1.33s/it] 72%|███████▏  | 44421/61904 [42:55<6:39:47,  1.37s/it] 72%|███████▏  | 44422/61904 [42:57<6:23:58,  1.32s/it] 72%|███████▏  | 44423/61904 [42:58<6:35:30,  1.36s/it] 72%|███████▏  | 44424/61904 [43:00<6:41:01,  1.38s/it] 72%|███████▏  | 44425/61904 [43:01<6:49:13,  1.40s/it] 72%|███████▏  | 44426/61904 [43:02<6:44:46,  1.39s/it] 72%|███████▏  | 44427/61904 [43:04<6:37:29,  1.36s/it] 72%|███████▏  | 44428/61904 [43:05<6:45:08,  1.39s/it] 72%|███████▏  | 44429/61904 [43:06<6:37:44,  1.37s/it] 72%|███████▏  | 44430/61904 [43:08<6:35:42,  1.36s/it] 72%|███████▏  | 44431/61904 [43:09<6:27:49,  1.33s/it] 72%|███████▏  | 44432/61904 [43:10<6:26:53,  1.33s/it] 72%|███████▏  | 44433/61904 [43:12<6:27:16,  1.33s/it] 72%|███████▏  | 44434/61904 [43:13<6:50:50,  1.41s/it] 72%|███████▏  | 44435/61904 [43:15<6:53:07,  1.42s/it] 72%|███████▏  | 44436/61904 [43:16<7:03:36,  1.46s/it] 72%|███████▏  | 44437/61904 [43:18<7:14:19,  1.49s/it] 72%|███████▏  | 44438/61904 [43:19<7:06:02,  1.46s/it] 72%|███████▏  | 44439/61904 [43:21<7:00:32,  1.44s/it] 72%|███████▏  | 44440/61904 [43:22<6:49:54,  1.41s/it]                                                       {'loss': 2.4476, 'learning_rate': 1.2830286529236353e-07, 'epoch': 11.49}
 72%|███████▏  | 44440/61904 [43:22<6:49:54,  1.41s/it] 72%|███████▏  | 44441/61904 [43:23<6:43:50,  1.39s/it] 72%|███████▏  | 44442/61904 [43:25<6:43:06,  1.39s/it] 72%|███████▏  | 44443/61904 [43:26<6:51:45,  1.41s/it] 72%|███████▏  | 44444/61904 [43:28<6:44:38,  1.39s/it] 72%|███████▏  | 44445/61904 [43:29<6:34:45,  1.36s/it] 72%|███████▏  | 44446/61904 [43:30<6:29:33,  1.34s/it] 72%|███████▏  | 44447/61904 [43:32<6:46:44,  1.40s/it] 72%|███████▏  | 44448/61904 [43:33<6:52:54,  1.42s/it] 72%|███████▏  | 44449/61904 [43:34<6:50:53,  1.41s/it] 72%|███████▏  | 44450/61904 [43:36<7:01:47,  1.45s/it] 72%|███████▏  | 44451/61904 [43:37<6:45:59,  1.40s/it] 72%|███████▏  | 44452/61904 [43:39<6:48:45,  1.41s/it] 72%|███████▏  | 44453/61904 [43:40<6:39:36,  1.37s/it] 72%|███████▏  | 44454/61904 [43:42<7:03:16,  1.46s/it] 72%|███████▏  | 44455/61904 [43:43<7:19:10,  1.51s/it] 72%|███████▏  | 44456/61904 [43:45<6:58:30,  1.44s/it] 72%|███████▏  | 44457/61904 [43:46<6:59:22,  1.44s/it] 72%|███████▏  | 44458/61904 [43:47<6:54:47,  1.43s/it] 72%|███████▏  | 44459/61904 [43:49<6:51:27,  1.42s/it] 72%|███████▏  | 44460/61904 [43:50<6:41:55,  1.38s/it]                                                       {'loss': 2.4647, 'learning_rate': 1.282704524828212e-07, 'epoch': 11.49}
 72%|███████▏  | 44460/61904 [43:50<6:41:55,  1.38s/it] 72%|███████▏  | 44461/61904 [43:52<6:48:48,  1.41s/it] 72%|███████▏  | 44462/61904 [43:53<6:40:44,  1.38s/it] 72%|███████▏  | 44463/61904 [43:54<6:52:04,  1.42s/it] 72%|███████▏  | 44464/61904 [43:56<6:53:25,  1.42s/it] 72%|███████▏  | 44465/61904 [43:57<6:48:17,  1.40s/it] 72%|███████▏  | 44466/61904 [43:59<6:45:27,  1.40s/it] 72%|███████▏  | 44467/61904 [44:00<6:47:04,  1.40s/it] 72%|███████▏  | 44468/61904 [44:01<6:36:43,  1.37s/it] 72%|███████▏  | 44469/61904 [44:03<6:30:30,  1.34s/it] 72%|███████▏  | 44470/61904 [44:04<6:39:21,  1.37s/it] 72%|███████▏  | 44471/61904 [44:05<6:30:27,  1.34s/it] 72%|███████▏  | 44472/61904 [44:07<7:07:22,  1.47s/it] 72%|███████▏  | 44473/61904 [44:08<7:01:36,  1.45s/it] 72%|███████▏  | 44474/61904 [44:10<6:44:46,  1.39s/it] 72%|███████▏  | 44475/61904 [44:11<6:50:30,  1.41s/it] 72%|███████▏  | 44476/61904 [44:13<6:48:47,  1.41s/it] 72%|███████▏  | 44477/61904 [44:14<6:40:47,  1.38s/it] 72%|███████▏  | 44478/61904 [44:15<6:28:08,  1.34s/it] 72%|███████▏  | 44479/61904 [44:16<6:22:36,  1.32s/it] 72%|███████▏  | 44480/61904 [44:18<6:36:20,  1.36s/it]                                                       {'loss': 2.4887, 'learning_rate': 1.2823803967327888e-07, 'epoch': 11.5}
 72%|███████▏  | 44480/61904 [44:18<6:36:20,  1.36s/it] 72%|███████▏  | 44481/61904 [44:19<6:30:36,  1.35s/it] 72%|███████▏  | 44482/61904 [44:21<6:37:15,  1.37s/it] 72%|███████▏  | 44483/61904 [44:22<6:36:10,  1.36s/it] 72%|███████▏  | 44484/61904 [44:23<6:48:25,  1.41s/it] 72%|███████▏  | 44485/61904 [44:25<6:55:22,  1.43s/it] 72%|███████▏  | 44486/61904 [44:26<6:42:27,  1.39s/it] 72%|███████▏  | 44487/61904 [44:28<6:40:25,  1.38s/it] 72%|███████▏  | 44488/61904 [44:29<6:52:50,  1.42s/it] 72%|███████▏  | 44489/61904 [44:30<6:40:46,  1.38s/it] 72%|███████▏  | 44490/61904 [44:32<6:56:40,  1.44s/it] 72%|███████▏  | 44491/61904 [44:33<7:00:15,  1.45s/it] 72%|███████▏  | 44492/61904 [44:35<6:43:51,  1.39s/it] 72%|███████▏  | 44493/61904 [44:36<6:39:59,  1.38s/it] 72%|███████▏  | 44494/61904 [44:37<6:36:06,  1.37s/it] 72%|███████▏  | 44495/61904 [44:39<6:29:06,  1.34s/it] 72%|███████▏  | 44496/61904 [44:40<6:34:20,  1.36s/it] 72%|███████▏  | 44497/61904 [44:41<6:37:29,  1.37s/it] 72%|███████▏  | 44498/61904 [44:43<6:32:08,  1.35s/it] 72%|███████▏  | 44499/61904 [44:44<6:30:31,  1.35s/it] 72%|███████▏  | 44500/61904 [44:46<6:40:23,  1.38s/it]                                                       {'loss': 2.4835, 'learning_rate': 1.2820562686373654e-07, 'epoch': 11.5}
 72%|███████▏  | 44500/61904 [44:46<6:40:23,  1.38s/it] 72%|███████▏  | 44501/61904 [44:47<6:51:44,  1.42s/it] 72%|███████▏  | 44502/61904 [44:48<6:49:51,  1.41s/it] 72%|███████▏  | 44503/61904 [44:50<6:41:11,  1.38s/it] 72%|███████▏  | 44504/61904 [44:51<6:42:03,  1.39s/it] 72%|███████▏  | 44505/61904 [44:52<6:36:32,  1.37s/it] 72%|███████▏  | 44506/61904 [44:54<6:42:20,  1.39s/it] 72%|███████▏  | 44507/61904 [44:55<6:41:07,  1.38s/it] 72%|███████▏  | 44508/61904 [44:57<6:35:03,  1.36s/it] 72%|███████▏  | 44509/61904 [44:58<6:43:41,  1.39s/it] 72%|███████▏  | 44510/61904 [44:59<6:34:49,  1.36s/it] 72%|███████▏  | 44511/61904 [45:01<6:26:21,  1.33s/it] 72%|███████▏  | 44512/61904 [45:02<6:30:02,  1.35s/it] 72%|███████▏  | 44513/61904 [45:03<6:26:07,  1.33s/it] 72%|███████▏  | 44514/61904 [45:05<6:34:38,  1.36s/it] 72%|███████▏  | 44515/61904 [45:06<6:25:17,  1.33s/it] 72%|███████▏  | 44516/61904 [45:07<6:28:52,  1.34s/it] 72%|███████▏  | 44517/61904 [45:09<6:29:47,  1.35s/it] 72%|███████▏  | 44518/61904 [45:10<6:29:27,  1.34s/it] 72%|███████▏  | 44519/61904 [45:11<6:35:51,  1.37s/it] 72%|███████▏  | 44520/61904 [45:13<6:39:05,  1.38s/it]                                                       {'loss': 2.4435, 'learning_rate': 1.281732140541942e-07, 'epoch': 11.51}
 72%|███████▏  | 44520/61904 [45:13<6:39:05,  1.38s/it] 72%|███████▏  | 44521/61904 [45:14<6:33:48,  1.36s/it] 72%|███████▏  | 44522/61904 [45:16<6:30:56,  1.35s/it] 72%|███████▏  | 44523/61904 [45:17<6:37:26,  1.37s/it] 72%|███████▏  | 44524/61904 [45:18<6:28:15,  1.34s/it] 72%|███████▏  | 44525/61904 [45:20<6:43:47,  1.39s/it] 72%|███████▏  | 44526/61904 [45:21<6:44:28,  1.40s/it] 72%|███████▏  | 44527/61904 [45:22<6:32:28,  1.36s/it] 72%|███████▏  | 44528/61904 [45:24<6:38:49,  1.38s/it] 72%|███████▏  | 44529/61904 [45:25<6:50:10,  1.42s/it] 72%|███████▏  | 44530/61904 [45:27<6:48:34,  1.41s/it] 72%|███████▏  | 44531/61904 [45:28<6:38:13,  1.38s/it] 72%|███████▏  | 44532/61904 [45:30<6:51:06,  1.42s/it] 72%|███████▏  | 44533/61904 [45:31<6:37:40,  1.37s/it] 72%|███████▏  | 44534/61904 [45:32<6:28:41,  1.34s/it] 72%|███████▏  | 44535/61904 [45:33<6:28:12,  1.34s/it] 72%|███████▏  | 44536/61904 [45:35<6:24:27,  1.33s/it] 72%|███████▏  | 44537/61904 [45:36<6:27:23,  1.34s/it] 72%|███████▏  | 44538/61904 [45:37<6:21:36,  1.32s/it] 72%|███████▏  | 44539/61904 [45:39<6:26:23,  1.34s/it] 72%|███████▏  | 44540/61904 [45:40<6:26:11,  1.33s/it]                                                       {'loss': 2.4716, 'learning_rate': 1.281408012446519e-07, 'epoch': 11.51}
 72%|███████▏  | 44540/61904 [45:40<6:26:11,  1.33s/it] 72%|███████▏  | 44541/61904 [45:42<6:36:11,  1.37s/it] 72%|███████▏  | 44542/61904 [45:43<6:34:27,  1.36s/it] 72%|███████▏  | 44543/61904 [45:44<6:28:41,  1.34s/it] 72%|███████▏  | 44544/61904 [45:45<6:18:42,  1.31s/it] 72%|███████▏  | 44545/61904 [45:47<6:13:39,  1.29s/it] 72%|███████▏  | 44546/61904 [45:48<6:06:44,  1.27s/it] 72%|███████▏  | 44547/61904 [45:49<6:25:15,  1.33s/it] 72%|███████▏  | 44548/61904 [45:51<6:31:13,  1.35s/it] 72%|███████▏  | 44549/61904 [45:52<6:32:45,  1.36s/it] 72%|███████▏  | 44550/61904 [45:54<6:50:04,  1.42s/it] 72%|███████▏  | 44551/61904 [45:55<6:39:06,  1.38s/it] 72%|███████▏  | 44552/61904 [45:56<6:42:59,  1.39s/it] 72%|███████▏  | 44553/61904 [45:58<6:46:36,  1.41s/it] 72%|███████▏  | 44554/61904 [45:59<6:48:16,  1.41s/it] 72%|███████▏  | 44555/61904 [46:01<6:47:23,  1.41s/it] 72%|███████▏  | 44556/61904 [46:02<7:03:05,  1.46s/it] 72%|███████▏  | 44557/61904 [46:04<6:48:12,  1.41s/it] 72%|███████▏  | 44558/61904 [46:05<6:58:00,  1.45s/it] 72%|███████▏  | 44559/61904 [46:07<7:01:15,  1.46s/it] 72%|███████▏  | 44560/61904 [46:08<6:51:49,  1.42s/it]                                                       {'loss': 2.457, 'learning_rate': 1.2810838843510955e-07, 'epoch': 11.52}
 72%|███████▏  | 44560/61904 [46:08<6:51:49,  1.42s/it] 72%|███████▏  | 44561/61904 [46:09<6:37:45,  1.38s/it] 72%|███████▏  | 44562/61904 [46:10<6:33:00,  1.36s/it] 72%|███████▏  | 44563/61904 [46:12<6:40:28,  1.39s/it] 72%|███████▏  | 44564/61904 [46:13<6:44:37,  1.40s/it] 72%|███████▏  | 44565/61904 [46:15<6:33:11,  1.36s/it] 72%|███████▏  | 44566/61904 [46:16<6:46:09,  1.41s/it] 72%|███████▏  | 44567/61904 [46:18<6:48:32,  1.41s/it] 72%|███████▏  | 44568/61904 [46:19<6:54:36,  1.43s/it] 72%|███████▏  | 44569/61904 [46:20<6:37:42,  1.38s/it] 72%|███████▏  | 44570/61904 [46:22<6:52:13,  1.43s/it] 72%|███████▏  | 44571/61904 [46:23<6:49:50,  1.42s/it] 72%|███████▏  | 44572/61904 [46:24<6:26:19,  1.34s/it] 72%|███████▏  | 44573/61904 [46:26<6:29:01,  1.35s/it] 72%|███████▏  | 44574/61904 [46:27<6:30:11,  1.35s/it] 72%|███████▏  | 44575/61904 [46:29<6:36:19,  1.37s/it] 72%|███████▏  | 44576/61904 [46:30<6:37:06,  1.38s/it] 72%|███████▏  | 44577/61904 [46:31<6:35:44,  1.37s/it] 72%|███████▏  | 44578/61904 [46:33<6:25:06,  1.33s/it] 72%|███████▏  | 44579/61904 [46:34<6:20:54,  1.32s/it] 72%|███████▏  | 44580/61904 [46:35<6:31:26,  1.36s/it]                                                       {'loss': 2.4465, 'learning_rate': 1.2807597562556721e-07, 'epoch': 11.52}
 72%|███████▏  | 44580/61904 [46:35<6:31:26,  1.36s/it] 72%|███████▏  | 44581/61904 [46:37<6:29:31,  1.35s/it] 72%|███████▏  | 44582/61904 [46:38<6:33:51,  1.36s/it] 72%|███████▏  | 44583/61904 [46:39<6:31:44,  1.36s/it] 72%|███████▏  | 44584/61904 [46:41<6:26:02,  1.34s/it] 72%|███████▏  | 44585/61904 [46:42<6:23:24,  1.33s/it] 72%|███████▏  | 44586/61904 [46:43<6:29:55,  1.35s/it] 72%|███████▏  | 44587/61904 [46:45<6:33:05,  1.36s/it] 72%|███████▏  | 44588/61904 [46:46<6:34:12,  1.37s/it] 72%|███████▏  | 44589/61904 [46:47<6:24:32,  1.33s/it] 72%|███████▏  | 44590/61904 [46:49<6:34:41,  1.37s/it] 72%|███████▏  | 44591/61904 [46:50<6:31:22,  1.36s/it] 72%|███████▏  | 44592/61904 [46:52<6:43:46,  1.40s/it] 72%|███████▏  | 44593/61904 [46:53<6:31:04,  1.36s/it] 72%|███████▏  | 44594/61904 [46:54<6:33:49,  1.37s/it] 72%|███████▏  | 44595/61904 [46:56<6:24:30,  1.33s/it] 72%|███████▏  | 44596/61904 [46:57<6:42:32,  1.40s/it] 72%|███████▏  | 44597/61904 [46:58<6:35:45,  1.37s/it] 72%|███████▏  | 44598/61904 [47:00<6:32:20,  1.36s/it] 72%|███████▏  | 44599/61904 [47:01<6:39:34,  1.39s/it] 72%|███████▏  | 44600/61904 [47:02<6:37:05,  1.38s/it]                                                       {'loss': 2.4804, 'learning_rate': 1.2804356281602488e-07, 'epoch': 11.53}
 72%|███████▏  | 44600/61904 [47:02<6:37:05,  1.38s/it] 72%|███████▏  | 44601/61904 [47:04<6:35:42,  1.37s/it] 72%|███████▏  | 44602/61904 [47:05<6:31:08,  1.36s/it] 72%|███████▏  | 44603/61904 [47:07<6:38:19,  1.38s/it] 72%|███████▏  | 44604/61904 [47:08<6:25:24,  1.34s/it] 72%|███████▏  | 44605/61904 [47:09<6:25:17,  1.34s/it] 72%|███████▏  | 44606/61904 [47:10<6:18:07,  1.31s/it] 72%|███████▏  | 44607/61904 [47:12<6:22:11,  1.33s/it] 72%|███████▏  | 44608/61904 [47:13<6:25:39,  1.34s/it] 72%|███████▏  | 44609/61904 [47:15<6:30:42,  1.36s/it] 72%|███████▏  | 44610/61904 [47:16<6:20:24,  1.32s/it] 72%|███████▏  | 44611/61904 [47:17<6:43:37,  1.40s/it] 72%|███████▏  | 44612/61904 [47:19<6:36:21,  1.38s/it] 72%|███████▏  | 44613/61904 [47:20<6:27:43,  1.35s/it] 72%|███████▏  | 44614/61904 [47:21<6:17:24,  1.31s/it] 72%|███████▏  | 44615/61904 [47:23<6:19:01,  1.32s/it] 72%|███████▏  | 44616/61904 [47:24<6:21:04,  1.32s/it] 72%|███████▏  | 44617/61904 [47:25<6:26:39,  1.34s/it] 72%|███████▏  | 44618/61904 [47:27<6:32:41,  1.36s/it] 72%|███████▏  | 44619/61904 [47:28<6:31:12,  1.36s/it] 72%|███████▏  | 44620/61904 [47:29<6:24:07,  1.33s/it]                                                       {'loss': 2.5168, 'learning_rate': 1.2801115000648256e-07, 'epoch': 11.53}
 72%|███████▏  | 44620/61904 [47:29<6:24:07,  1.33s/it] 72%|███████▏  | 44621/61904 [47:31<6:16:56,  1.31s/it] 72%|███████▏  | 44622/61904 [47:32<6:37:28,  1.38s/it] 72%|███████▏  | 44623/61904 [47:34<6:56:56,  1.45s/it] 72%|███████▏  | 44624/61904 [47:35<6:49:54,  1.42s/it] 72%|███████▏  | 44625/61904 [47:36<6:42:39,  1.40s/it] 72%|███████▏  | 44626/61904 [47:38<6:31:01,  1.36s/it] 72%|███████▏  | 44627/61904 [47:39<6:20:29,  1.32s/it] 72%|███████▏  | 44628/61904 [47:40<6:27:44,  1.35s/it] 72%|███████▏  | 44629/61904 [47:42<6:22:45,  1.33s/it] 72%|███████▏  | 44630/61904 [47:43<6:22:32,  1.33s/it] 72%|███████▏  | 44631/61904 [47:44<6:25:38,  1.34s/it] 72%|███████▏  | 44632/61904 [47:46<6:31:06,  1.36s/it] 72%|███████▏  | 44633/61904 [47:47<6:34:25,  1.37s/it] 72%|███████▏  | 44634/61904 [47:48<6:29:09,  1.35s/it] 72%|███████▏  | 44635/61904 [47:50<6:22:50,  1.33s/it] 72%|███████▏  | 44636/61904 [47:51<6:27:37,  1.35s/it] 72%|███████▏  | 44637/61904 [47:53<6:38:10,  1.38s/it] 72%|███████▏  | 44638/61904 [47:54<6:37:33,  1.38s/it] 72%|███████▏  | 44639/61904 [47:55<6:35:25,  1.37s/it] 72%|███████▏  | 44640/61904 [47:57<6:23:32,  1.33s/it]                                                       {'loss': 2.4759, 'learning_rate': 1.2797873719694023e-07, 'epoch': 11.54}
 72%|███████▏  | 44640/61904 [47:57<6:23:32,  1.33s/it] 72%|███████▏  | 44641/61904 [47:58<6:24:44,  1.34s/it] 72%|███████▏  | 44642/61904 [47:59<6:23:02,  1.33s/it] 72%|███████▏  | 44643/61904 [48:01<6:41:13,  1.39s/it] 72%|███████▏  | 44644/61904 [48:02<6:34:12,  1.37s/it] 72%|███████▏  | 44645/61904 [48:04<6:44:23,  1.41s/it] 72%|███████▏  | 44646/61904 [48:05<6:39:11,  1.39s/it] 72%|███████▏  | 44647/61904 [48:06<6:30:14,  1.36s/it] 72%|███████▏  | 44648/61904 [48:07<6:28:41,  1.35s/it] 72%|███████▏  | 44649/61904 [48:09<6:31:34,  1.36s/it] 72%|███████▏  | 44650/61904 [48:10<6:36:16,  1.38s/it] 72%|███████▏  | 44651/61904 [48:12<6:34:34,  1.37s/it] 72%|███████▏  | 44652/61904 [48:13<6:28:52,  1.35s/it] 72%|███████▏  | 44653/61904 [48:14<6:31:54,  1.36s/it] 72%|███████▏  | 44654/61904 [48:16<6:46:33,  1.41s/it] 72%|███████▏  | 44655/61904 [48:17<6:42:44,  1.40s/it] 72%|███████▏  | 44656/61904 [48:19<6:34:48,  1.37s/it] 72%|███████▏  | 44657/61904 [48:20<6:21:11,  1.33s/it] 72%|███████▏  | 44658/61904 [48:21<6:27:57,  1.35s/it] 72%|███████▏  | 44659/61904 [48:23<6:40:46,  1.39s/it] 72%|███████▏  | 44660/61904 [48:24<6:36:55,  1.38s/it]                                                       {'loss': 2.4929, 'learning_rate': 1.279463243873979e-07, 'epoch': 11.54}
 72%|███████▏  | 44660/61904 [48:24<6:36:55,  1.38s/it] 72%|███████▏  | 44661/61904 [48:25<6:21:07,  1.33s/it] 72%|███████▏  | 44662/61904 [48:27<6:23:49,  1.34s/it] 72%|███████▏  | 44663/61904 [48:28<6:16:00,  1.31s/it] 72%|███████▏  | 44664/61904 [48:29<6:16:33,  1.31s/it] 72%|███████▏  | 44665/61904 [48:30<6:14:43,  1.30s/it] 72%|███████▏  | 44666/61904 [48:32<6:34:27,  1.37s/it] 72%|███████▏  | 44667/61904 [48:33<6:30:16,  1.36s/it] 72%|███████▏  | 44668/61904 [48:35<6:28:17,  1.35s/it] 72%|███████▏  | 44669/61904 [48:36<6:31:26,  1.36s/it] 72%|███████▏  | 44670/61904 [48:37<6:27:15,  1.35s/it] 72%|███████▏  | 44671/61904 [48:39<6:31:56,  1.36s/it] 72%|███████▏  | 44672/61904 [48:40<6:34:00,  1.37s/it] 72%|███████▏  | 44673/61904 [48:42<6:45:17,  1.41s/it] 72%|███████▏  | 44674/61904 [48:43<6:39:53,  1.39s/it] 72%|███████▏  | 44675/61904 [48:44<6:45:07,  1.41s/it] 72%|███████▏  | 44676/61904 [48:46<6:47:44,  1.42s/it] 72%|███████▏  | 44677/61904 [48:47<6:42:10,  1.40s/it] 72%|███████▏  | 44678/61904 [48:49<6:43:40,  1.41s/it] 72%|███████▏  | 44679/61904 [48:50<6:29:32,  1.36s/it] 72%|███████▏  | 44680/61904 [48:51<6:30:44,  1.36s/it]                                                       {'loss': 2.4136, 'learning_rate': 1.2791391157785555e-07, 'epoch': 11.55}
 72%|███████▏  | 44680/61904 [48:51<6:30:44,  1.36s/it] 72%|███████▏  | 44681/61904 [48:53<6:40:19,  1.39s/it] 72%|███████▏  | 44682/61904 [48:54<6:35:37,  1.38s/it] 72%|███████▏  | 44683/61904 [48:55<6:39:47,  1.39s/it] 72%|███████▏  | 44684/61904 [48:57<6:40:07,  1.39s/it] 72%|███████▏  | 44685/61904 [48:58<6:37:29,  1.39s/it] 72%|███████▏  | 44686/61904 [48:59<6:21:52,  1.33s/it] 72%|███████▏  | 44687/61904 [49:01<6:34:41,  1.38s/it] 72%|███████▏  | 44688/61904 [49:02<6:30:20,  1.36s/it] 72%|███████▏  | 44689/61904 [49:04<6:24:58,  1.34s/it] 72%|███████▏  | 44690/61904 [49:05<6:50:23,  1.43s/it] 72%|███████▏  | 44691/61904 [49:07<6:49:38,  1.43s/it] 72%|███████▏  | 44692/61904 [49:08<6:30:54,  1.36s/it] 72%|███████▏  | 44693/61904 [49:09<6:38:55,  1.39s/it] 72%|███████▏  | 44694/61904 [49:11<6:37:25,  1.39s/it] 72%|███████▏  | 44695/61904 [49:12<6:43:03,  1.41s/it] 72%|███████▏  | 44696/61904 [49:14<6:49:46,  1.43s/it] 72%|███████▏  | 44697/61904 [49:15<6:37:17,  1.39s/it] 72%|███████▏  | 44698/61904 [49:16<6:38:59,  1.39s/it] 72%|███████▏  | 44699/61904 [49:18<6:38:20,  1.39s/it] 72%|███████▏  | 44700/61904 [49:19<6:28:15,  1.35s/it]                                                       {'loss': 2.4497, 'learning_rate': 1.2788149876831324e-07, 'epoch': 11.55}
 72%|███████▏  | 44700/61904 [49:19<6:28:15,  1.35s/it] 72%|███████▏  | 44701/61904 [49:20<6:26:19,  1.35s/it] 72%|███████▏  | 44702/61904 [49:22<6:28:44,  1.36s/it] 72%|███████▏  | 44703/61904 [49:23<6:35:46,  1.38s/it] 72%|███████▏  | 44704/61904 [49:24<6:25:30,  1.34s/it] 72%|███████▏  | 44705/61904 [49:26<6:17:37,  1.32s/it] 72%|███████▏  | 44706/61904 [49:27<6:09:08,  1.29s/it] 72%|███████▏  | 44707/61904 [49:28<6:06:48,  1.28s/it] 72%|███████▏  | 44708/61904 [49:30<6:22:25,  1.33s/it] 72%|███████▏  | 44709/61904 [49:31<6:28:22,  1.36s/it] 72%|███████▏  | 44710/61904 [49:32<6:27:17,  1.35s/it] 72%|███████▏  | 44711/61904 [49:34<6:29:32,  1.36s/it] 72%|███████▏  | 44712/61904 [49:35<6:20:43,  1.33s/it] 72%|███████▏  | 44713/61904 [49:36<6:21:52,  1.33s/it] 72%|███████▏  | 44714/61904 [49:38<6:18:25,  1.32s/it] 72%|███████▏  | 44715/61904 [49:39<6:37:51,  1.39s/it] 72%|███████▏  | 44716/61904 [49:40<6:34:51,  1.38s/it] 72%|███████▏  | 44717/61904 [49:42<6:27:15,  1.35s/it] 72%|███████▏  | 44718/61904 [49:43<6:36:20,  1.38s/it] 72%|███████▏  | 44719/61904 [49:45<6:34:07,  1.38s/it] 72%|███████▏  | 44720/61904 [49:46<6:42:38,  1.41s/it]                                                       {'loss': 2.4912, 'learning_rate': 1.278490859587709e-07, 'epoch': 11.56}
 72%|███████▏  | 44720/61904 [49:46<6:42:38,  1.41s/it] 72%|███████▏  | 44721/61904 [49:47<6:36:51,  1.39s/it] 72%|███████▏  | 44722/61904 [49:49<6:37:01,  1.39s/it] 72%|███████▏  | 44723/61904 [49:50<6:26:23,  1.35s/it] 72%|███████▏  | 44724/61904 [49:51<6:29:49,  1.36s/it] 72%|███████▏  | 44725/61904 [49:53<6:36:24,  1.38s/it] 72%|███████▏  | 44726/61904 [49:54<6:28:02,  1.36s/it] 72%|███████▏  | 44727/61904 [49:56<6:35:17,  1.38s/it] 72%|███████▏  | 44728/61904 [49:57<6:39:02,  1.39s/it] 72%|███████▏  | 44729/61904 [49:58<6:31:07,  1.37s/it] 72%|███████▏  | 44730/61904 [50:00<6:43:52,  1.41s/it] 72%|███████▏  | 44731/61904 [50:01<6:50:16,  1.43s/it] 72%|███████▏  | 44732/61904 [50:03<6:50:12,  1.43s/it] 72%|███████▏  | 44733/61904 [50:04<6:48:29,  1.43s/it] 72%|███████▏  | 44734/61904 [50:06<6:41:40,  1.40s/it] 72%|███████▏  | 44735/61904 [50:07<6:39:55,  1.40s/it] 72%|███████▏  | 44736/61904 [50:08<6:46:19,  1.42s/it] 72%|███████▏  | 44737/61904 [50:10<6:45:43,  1.42s/it] 72%|███████▏  | 44738/61904 [50:11<6:58:56,  1.46s/it] 72%|███████▏  | 44739/61904 [50:13<6:55:53,  1.45s/it] 72%|███████▏  | 44740/61904 [50:14<7:02:06,  1.48s/it]                                                       {'loss': 2.5089, 'learning_rate': 1.2781667314922856e-07, 'epoch': 11.56}
 72%|███████▏  | 44740/61904 [50:14<7:02:06,  1.48s/it] 72%|███████▏  | 44741/61904 [50:16<6:59:10,  1.47s/it] 72%|███████▏  | 44742/61904 [50:17<6:46:28,  1.42s/it] 72%|███████▏  | 44743/61904 [50:18<6:39:40,  1.40s/it] 72%|███████▏  | 44744/61904 [50:20<6:46:25,  1.42s/it] 72%|███████▏  | 44745/61904 [50:21<6:38:49,  1.39s/it] 72%|███████▏  | 44746/61904 [50:22<6:28:08,  1.36s/it] 72%|███████▏  | 44747/61904 [50:24<6:25:21,  1.35s/it] 72%|███████▏  | 44748/61904 [50:25<6:16:55,  1.32s/it] 72%|███████▏  | 44749/61904 [50:26<6:10:23,  1.30s/it] 72%|███████▏  | 44750/61904 [50:28<6:24:53,  1.35s/it] 72%|███████▏  | 44751/61904 [50:29<6:26:25,  1.35s/it] 72%|███████▏  | 44752/61904 [50:30<6:23:39,  1.34s/it] 72%|███████▏  | 44753/61904 [50:32<6:21:36,  1.33s/it] 72%|███████▏  | 44754/61904 [50:33<6:38:41,  1.39s/it] 72%|███████▏  | 44755/61904 [50:35<6:38:22,  1.39s/it] 72%|███████▏  | 44756/61904 [50:36<6:36:11,  1.39s/it] 72%|███████▏  | 44757/61904 [50:37<6:29:50,  1.36s/it] 72%|███████▏  | 44758/61904 [50:39<6:17:41,  1.32s/it] 72%|███████▏  | 44759/61904 [50:40<6:30:15,  1.37s/it] 72%|███████▏  | 44760/61904 [50:41<6:34:38,  1.38s/it]                                                       {'loss': 2.4516, 'learning_rate': 1.2778426033968622e-07, 'epoch': 11.57}
 72%|███████▏  | 44760/61904 [50:41<6:34:38,  1.38s/it] 72%|███████▏  | 44761/61904 [50:43<6:43:50,  1.41s/it] 72%|███████▏  | 44762/61904 [50:44<6:42:06,  1.41s/it] 72%|███████▏  | 44763/61904 [50:46<6:40:11,  1.40s/it] 72%|███████▏  | 44764/61904 [50:47<6:34:13,  1.38s/it] 72%|███████▏  | 44765/61904 [50:48<6:32:08,  1.37s/it] 72%|███████▏  | 44766/61904 [50:50<6:40:24,  1.40s/it] 72%|███████▏  | 44767/61904 [50:51<6:37:37,  1.39s/it] 72%|███████▏  | 44768/61904 [50:53<6:28:50,  1.36s/it] 72%|███████▏  | 44769/61904 [50:54<6:41:44,  1.41s/it] 72%|███████▏  | 44770/61904 [50:55<6:39:34,  1.40s/it] 72%|███████▏  | 44771/61904 [50:57<6:32:30,  1.37s/it] 72%|███████▏  | 44772/61904 [50:58<6:35:38,  1.39s/it] 72%|███████▏  | 44773/61904 [51:00<6:35:14,  1.38s/it] 72%|███████▏  | 44774/61904 [51:01<6:40:12,  1.40s/it] 72%|███████▏  | 44775/61904 [51:02<6:34:11,  1.38s/it] 72%|███████▏  | 44776/61904 [51:04<6:37:09,  1.39s/it] 72%|███████▏  | 44777/61904 [51:05<6:28:57,  1.36s/it] 72%|███████▏  | 44778/61904 [51:07<6:37:25,  1.39s/it] 72%|███████▏  | 44779/61904 [51:08<6:23:15,  1.34s/it] 72%|███████▏  | 44780/61904 [51:09<6:32:17,  1.37s/it]                                                       {'loss': 2.5023, 'learning_rate': 1.277518475301439e-07, 'epoch': 11.57}
 72%|███████▏  | 44780/61904 [51:09<6:32:17,  1.37s/it] 72%|███████▏  | 44781/61904 [51:11<6:32:25,  1.38s/it] 72%|███████▏  | 44782/61904 [51:12<6:23:02,  1.34s/it] 72%|███████▏  | 44783/61904 [51:13<6:30:51,  1.37s/it] 72%|███████▏  | 44784/61904 [51:15<6:20:46,  1.33s/it] 72%|███████▏  | 44785/61904 [51:16<6:21:21,  1.34s/it] 72%|███████▏  | 44786/61904 [51:17<6:19:10,  1.33s/it] 72%|███████▏  | 44787/61904 [51:18<6:08:22,  1.29s/it] 72%|███████▏  | 44788/61904 [51:20<6:14:55,  1.31s/it] 72%|███████▏  | 44789/61904 [51:21<6:22:22,  1.34s/it] 72%|███████▏  | 44790/61904 [51:22<6:21:04,  1.34s/it] 72%|███████▏  | 44791/61904 [51:24<6:27:31,  1.36s/it] 72%|███████▏  | 44792/61904 [51:25<6:33:02,  1.38s/it] 72%|███████▏  | 44793/61904 [51:27<6:25:08,  1.35s/it] 72%|███████▏  | 44794/61904 [51:28<6:26:40,  1.36s/it] 72%|███████▏  | 44795/61904 [51:29<6:18:54,  1.33s/it] 72%|███████▏  | 44796/61904 [51:30<6:10:58,  1.30s/it] 72%|███████▏  | 44797/61904 [51:32<6:06:06,  1.28s/it] 72%|███████▏  | 44798/61904 [51:33<6:08:41,  1.29s/it] 72%|███████▏  | 44799/61904 [51:34<6:15:45,  1.32s/it] 72%|███████▏  | 44800/61904 [51:36<6:30:17,  1.37s/it]                                                       {'loss': 2.4883, 'learning_rate': 1.2771943472060157e-07, 'epoch': 11.58}
 72%|███████▏  | 44800/61904 [51:36<6:30:17,  1.37s/it] 72%|███████▏  | 44801/61904 [51:37<6:32:24,  1.38s/it] 72%|███████▏  | 44802/61904 [51:39<6:33:07,  1.38s/it] 72%|███████▏  | 44803/61904 [51:40<6:30:10,  1.37s/it] 72%|███████▏  | 44804/61904 [51:41<6:30:16,  1.37s/it] 72%|███████▏  | 44805/61904 [51:43<6:34:37,  1.38s/it] 72%|███████▏  | 44806/61904 [51:44<6:30:11,  1.37s/it] 72%|███████▏  | 44807/61904 [51:45<6:25:25,  1.35s/it] 72%|███████▏  | 44808/61904 [51:47<6:17:44,  1.33s/it] 72%|███████▏  | 44809/61904 [51:48<6:20:56,  1.34s/it] 72%|███████▏  | 44810/61904 [51:50<6:44:19,  1.42s/it] 72%|███████▏  | 44811/61904 [51:51<6:39:11,  1.40s/it] 72%|███████▏  | 44812/61904 [51:52<6:22:13,  1.34s/it] 72%|███████▏  | 44813/61904 [51:54<6:22:20,  1.34s/it] 72%|███████▏  | 44814/61904 [51:55<6:25:04,  1.35s/it] 72%|███████▏  | 44815/61904 [51:56<6:32:51,  1.38s/it] 72%|███████▏  | 44816/61904 [51:58<6:29:50,  1.37s/it] 72%|███████▏  | 44817/61904 [51:59<6:27:05,  1.36s/it] 72%|███████▏  | 44818/61904 [52:01<6:37:53,  1.40s/it] 72%|███████▏  | 44819/61904 [52:02<6:28:24,  1.36s/it] 72%|███████▏  | 44820/61904 [52:03<6:25:29,  1.35s/it]                                                       {'loss': 2.4885, 'learning_rate': 1.2768702191105924e-07, 'epoch': 11.58}
 72%|███████▏  | 44820/61904 [52:03<6:25:29,  1.35s/it] 72%|███████▏  | 44821/61904 [52:05<6:30:57,  1.37s/it] 72%|███████▏  | 44822/61904 [52:06<6:35:48,  1.39s/it] 72%|███████▏  | 44823/61904 [52:07<6:34:04,  1.38s/it] 72%|███████▏  | 44824/61904 [52:09<6:29:36,  1.37s/it] 72%|███████▏  | 44825/61904 [52:10<6:24:36,  1.35s/it] 72%|███████▏  | 44826/61904 [52:11<6:27:52,  1.36s/it] 72%|███████▏  | 44827/61904 [52:13<6:26:13,  1.36s/it] 72%|███████▏  | 44828/61904 [52:14<6:39:50,  1.40s/it] 72%|███████▏  | 44829/61904 [52:16<6:30:35,  1.37s/it] 72%|███████▏  | 44830/61904 [52:17<6:32:01,  1.38s/it] 72%|███████▏  | 44831/61904 [52:18<6:29:59,  1.37s/it] 72%|███████▏  | 44832/61904 [52:20<6:27:06,  1.36s/it] 72%|███████▏  | 44833/61904 [52:21<6:32:17,  1.38s/it] 72%|███████▏  | 44834/61904 [52:22<6:23:26,  1.35s/it] 72%|███████▏  | 44835/61904 [52:24<6:17:17,  1.33s/it] 72%|███████▏  | 44836/61904 [52:25<6:14:10,  1.32s/it] 72%|███████▏  | 44837/61904 [52:26<6:07:23,  1.29s/it] 72%|███████▏  | 44838/61904 [52:28<6:16:58,  1.33s/it] 72%|███████▏  | 44839/61904 [52:29<6:24:44,  1.35s/it] 72%|███████▏  | 44840/61904 [52:30<6:21:56,  1.34s/it]                                                       {'loss': 2.5421, 'learning_rate': 1.2765460910151692e-07, 'epoch': 11.59}
 72%|███████▏  | 44840/61904 [52:30<6:21:56,  1.34s/it] 72%|███████▏  | 44841/61904 [52:32<6:23:18,  1.35s/it] 72%|███████▏  | 44842/61904 [52:33<6:22:04,  1.34s/it] 72%|███████▏  | 44843/61904 [52:34<6:22:42,  1.35s/it] 72%|███████▏  | 44844/61904 [52:36<6:28:53,  1.37s/it] 72%|███████▏  | 44845/61904 [52:37<6:28:21,  1.37s/it] 72%|███████▏  | 44846/61904 [52:39<6:29:16,  1.37s/it] 72%|███████▏  | 44847/61904 [52:40<6:28:31,  1.37s/it] 72%|███████▏  | 44848/61904 [52:41<6:35:10,  1.39s/it] 72%|███████▏  | 44849/61904 [52:43<6:23:11,  1.35s/it] 72%|███████▏  | 44850/61904 [52:44<6:15:27,  1.32s/it] 72%|███████▏  | 44851/61904 [52:45<6:27:31,  1.36s/it] 72%|███████▏  | 44852/61904 [52:47<6:31:26,  1.38s/it] 72%|███████▏  | 44853/61904 [52:48<6:33:42,  1.39s/it] 72%|███████▏  | 44854/61904 [52:50<6:35:51,  1.39s/it] 72%|███████▏  | 44855/61904 [52:51<6:36:59,  1.40s/it] 72%|███████▏  | 44856/61904 [52:52<6:32:03,  1.38s/it] 72%|███████▏  | 44857/61904 [52:54<6:27:25,  1.36s/it] 72%|███████▏  | 44858/61904 [52:55<6:23:05,  1.35s/it] 72%|███████▏  | 44859/61904 [52:56<6:36:49,  1.40s/it] 72%|███████▏  | 44860/61904 [52:58<6:31:39,  1.38s/it]                                                       {'loss': 2.4938, 'learning_rate': 1.2762219629197459e-07, 'epoch': 11.59}
 72%|███████▏  | 44860/61904 [52:58<6:31:39,  1.38s/it] 72%|███████▏  | 44861/61904 [52:59<6:39:39,  1.41s/it] 72%|███████▏  | 44862/61904 [53:01<6:38:46,  1.40s/it] 72%|███████▏  | 44863/61904 [53:02<6:44:03,  1.42s/it] 72%|███████▏  | 44864/61904 [53:03<6:38:00,  1.40s/it] 72%|███████▏  | 44865/61904 [53:05<6:41:10,  1.41s/it] 72%|███████▏  | 44866/61904 [53:06<6:34:11,  1.39s/it] 72%|███████▏  | 44867/61904 [53:08<6:49:47,  1.44s/it] 72%|███████▏  | 44868/61904 [53:09<6:48:22,  1.44s/it] 72%|███████▏  | 44869/61904 [53:10<6:35:14,  1.39s/it] 72%|███████▏  | 44870/61904 [53:12<6:32:30,  1.38s/it] 72%|███████▏  | 44871/61904 [53:13<6:28:06,  1.37s/it] 72%|███████▏  | 44872/61904 [53:15<6:29:12,  1.37s/it] 72%|███████▏  | 44873/61904 [53:16<6:28:40,  1.37s/it] 72%|███████▏  | 44874/61904 [53:17<6:28:45,  1.37s/it] 72%|███████▏  | 44875/61904 [53:19<6:51:15,  1.45s/it] 72%|███████▏  | 44876/61904 [53:20<6:45:21,  1.43s/it] 72%|███████▏  | 44877/61904 [53:22<6:32:18,  1.38s/it] 72%|███████▏  | 44878/61904 [53:23<6:39:59,  1.41s/it] 72%|███████▏  | 44879/61904 [53:24<6:40:09,  1.41s/it] 72%|███████▏  | 44880/61904 [53:26<6:47:41,  1.44s/it]                                                       {'loss': 2.4712, 'learning_rate': 1.2758978348243225e-07, 'epoch': 11.6}
 72%|███████▏  | 44880/61904 [53:26<6:47:41,  1.44s/it] 73%|███████▎  | 44881/61904 [53:27<6:33:05,  1.39s/it] 73%|███████▎  | 44882/61904 [53:29<6:28:24,  1.37s/it] 73%|███████▎  | 44883/61904 [53:30<6:35:44,  1.39s/it] 73%|███████▎  | 44884/61904 [53:32<6:51:02,  1.45s/it] 73%|███████▎  | 44885/61904 [53:33<6:38:05,  1.40s/it] 73%|███████▎  | 44886/61904 [53:34<6:27:44,  1.37s/it] 73%|███████▎  | 44887/61904 [53:36<6:23:44,  1.35s/it] 73%|███████▎  | 44888/61904 [53:37<6:27:21,  1.37s/it] 73%|███████▎  | 44889/61904 [53:38<6:26:26,  1.36s/it] 73%|███████▎  | 44890/61904 [53:40<6:33:37,  1.39s/it] 73%|███████▎  | 44891/61904 [53:41<6:26:52,  1.36s/it] 73%|███████▎  | 44892/61904 [53:42<6:30:24,  1.38s/it] 73%|███████▎  | 44893/61904 [53:44<6:28:02,  1.37s/it] 73%|███████▎  | 44894/61904 [53:45<6:20:08,  1.34s/it] 73%|███████▎  | 44895/61904 [53:46<6:18:35,  1.34s/it] 73%|███████▎  | 44896/61904 [53:48<6:22:04,  1.35s/it] 73%|███████▎  | 44897/61904 [53:49<6:14:25,  1.32s/it] 73%|███████▎  | 44898/61904 [53:50<6:26:54,  1.37s/it] 73%|███████▎  | 44899/61904 [53:52<6:15:44,  1.33s/it] 73%|███████▎  | 44900/61904 [53:53<6:21:23,  1.35s/it]                                                       {'loss': 2.5227, 'learning_rate': 1.275573706728899e-07, 'epoch': 11.6}
 73%|███████▎  | 44900/61904 [53:53<6:21:23,  1.35s/it] 73%|███████▎  | 44901/61904 [53:55<6:36:16,  1.40s/it] 73%|███████▎  | 44902/61904 [53:56<6:47:59,  1.44s/it] 73%|███████▎  | 44903/61904 [53:58<6:41:27,  1.42s/it] 73%|███████▎  | 44904/61904 [53:59<6:42:06,  1.42s/it] 73%|███████▎  | 44905/61904 [54:00<6:47:47,  1.44s/it] 73%|███████▎  | 44906/61904 [54:02<6:51:23,  1.45s/it] 73%|███████▎  | 44907/61904 [54:03<6:51:33,  1.45s/it] 73%|███████▎  | 44908/61904 [54:05<6:47:31,  1.44s/it] 73%|███████▎  | 44909/61904 [54:06<6:37:59,  1.41s/it] 73%|███████▎  | 44910/61904 [54:08<6:40:56,  1.42s/it] 73%|███████▎  | 44911/61904 [54:09<6:35:02,  1.39s/it] 73%|███████▎  | 44912/61904 [54:10<6:45:48,  1.43s/it] 73%|███████▎  | 44913/61904 [54:12<6:37:42,  1.40s/it] 73%|███████▎  | 44914/61904 [54:13<6:29:32,  1.38s/it] 73%|███████▎  | 44915/61904 [54:15<6:49:10,  1.45s/it] 73%|███████▎  | 44916/61904 [54:16<6:51:44,  1.45s/it] 73%|███████▎  | 44917/61904 [54:18<6:48:49,  1.44s/it] 73%|███████▎  | 44918/61904 [54:19<7:17:32,  1.55s/it] 73%|███████▎  | 44919/61904 [54:21<7:09:40,  1.52s/it] 73%|███████▎  | 44920/61904 [54:22<7:07:05,  1.51s/it]                                                       {'loss': 2.4463, 'learning_rate': 1.275249578633476e-07, 'epoch': 11.61}
 73%|███████▎  | 44920/61904 [54:22<7:07:05,  1.51s/it] 73%|███████▎  | 44921/61904 [54:24<6:53:55,  1.46s/it] 73%|███████▎  | 44922/61904 [54:25<6:56:42,  1.47s/it] 73%|███████▎  | 44923/61904 [54:27<6:50:14,  1.45s/it] 73%|███████▎  | 44924/61904 [54:28<6:37:40,  1.41s/it] 73%|███████▎  | 44925/61904 [54:29<6:39:39,  1.41s/it] 73%|███████▎  | 44926/61904 [54:31<6:30:14,  1.38s/it] 73%|███████▎  | 44927/61904 [54:32<6:44:37,  1.43s/it] 73%|███████▎  | 44928/61904 [54:34<6:42:45,  1.42s/it] 73%|███████▎  | 44929/61904 [54:35<6:59:00,  1.48s/it] 73%|███████▎  | 44930/61904 [54:36<6:39:03,  1.41s/it] 73%|███████▎  | 44931/61904 [54:38<6:37:18,  1.40s/it] 73%|███████▎  | 44932/61904 [54:39<6:28:06,  1.37s/it] 73%|███████▎  | 44933/61904 [54:40<6:29:53,  1.38s/it] 73%|███████▎  | 44934/61904 [54:42<6:37:22,  1.40s/it] 73%|███████▎  | 44935/61904 [54:43<6:28:42,  1.37s/it] 73%|███████▎  | 44936/61904 [54:45<6:31:50,  1.39s/it] 73%|███████▎  | 44937/61904 [54:46<6:23:54,  1.36s/it] 73%|███████▎  | 44938/61904 [54:47<6:17:46,  1.34s/it] 73%|███████▎  | 44939/61904 [54:49<6:19:59,  1.34s/it] 73%|███████▎  | 44940/61904 [54:50<6:19:14,  1.34s/it]                                                       {'loss': 2.4526, 'learning_rate': 1.2749254505380526e-07, 'epoch': 11.62}
 73%|███████▎  | 44940/61904 [54:50<6:19:14,  1.34s/it] 73%|███████▎  | 44941/61904 [54:51<6:28:44,  1.38s/it] 73%|███████▎  | 44942/61904 [54:53<6:23:13,  1.36s/it] 73%|███████▎  | 44943/61904 [54:54<6:20:49,  1.35s/it] 73%|███████▎  | 44944/61904 [54:55<6:23:57,  1.36s/it] 73%|███████▎  | 44945/61904 [54:57<6:29:35,  1.38s/it] 73%|███████▎  | 44946/61904 [54:58<6:35:40,  1.40s/it] 73%|███████▎  | 44947/61904 [55:00<6:32:00,  1.39s/it] 73%|███████▎  | 44948/61904 [55:01<6:30:39,  1.38s/it] 73%|███████▎  | 44949/61904 [55:02<6:29:47,  1.38s/it] 73%|███████▎  | 44950/61904 [55:04<6:40:26,  1.42s/it] 73%|███████▎  | 44951/61904 [55:05<6:35:44,  1.40s/it] 73%|███████▎  | 44952/61904 [55:07<6:29:29,  1.38s/it] 73%|███████▎  | 44953/61904 [55:08<6:31:08,  1.38s/it] 73%|███████▎  | 44954/61904 [55:09<6:31:19,  1.39s/it] 73%|███████▎  | 44955/61904 [55:11<6:24:52,  1.36s/it] 73%|███████▎  | 44956/61904 [55:12<6:26:47,  1.37s/it] 73%|███████▎  | 44957/61904 [55:14<6:36:54,  1.41s/it] 73%|███████▎  | 44958/61904 [55:15<6:34:06,  1.40s/it] 73%|███████▎  | 44959/61904 [55:16<6:49:45,  1.45s/it] 73%|███████▎  | 44960/61904 [55:18<6:53:03,  1.46s/it]                                                       {'loss': 2.4763, 'learning_rate': 1.2746013224426292e-07, 'epoch': 11.62}
 73%|███████▎  | 44960/61904 [55:18<6:53:03,  1.46s/it] 73%|███████▎  | 44961/61904 [55:19<6:39:18,  1.41s/it] 73%|███████▎  | 44962/61904 [55:21<6:38:06,  1.41s/it] 73%|███████▎  | 44963/61904 [55:22<6:44:32,  1.43s/it] 73%|███████▎  | 44964/61904 [55:24<6:39:13,  1.41s/it] 73%|███████▎  | 44965/61904 [55:25<6:38:13,  1.41s/it] 73%|███████▎  | 44966/61904 [55:26<6:26:18,  1.37s/it] 73%|███████▎  | 44967/61904 [55:28<6:26:58,  1.37s/it] 73%|███████▎  | 44968/61904 [55:29<6:30:36,  1.38s/it] 73%|███████▎  | 44969/61904 [55:30<6:22:23,  1.35s/it] 73%|███████▎  | 44970/61904 [55:32<6:27:02,  1.37s/it] 73%|███████▎  | 44971/61904 [55:33<6:28:39,  1.38s/it] 73%|███████▎  | 44972/61904 [55:34<6:25:31,  1.37s/it] 73%|███████▎  | 44973/61904 [55:36<6:28:42,  1.38s/it] 73%|███████▎  | 44974/61904 [55:37<6:31:21,  1.39s/it] 73%|███████▎  | 44975/61904 [55:39<6:21:57,  1.35s/it] 73%|███████▎  | 44976/61904 [55:40<6:31:02,  1.39s/it] 73%|███████▎  | 44977/61904 [55:41<6:22:14,  1.35s/it] 73%|███████▎  | 44978/61904 [55:43<6:19:14,  1.34s/it] 73%|███████▎  | 44979/61904 [55:44<6:18:35,  1.34s/it] 73%|███████▎  | 44980/61904 [55:45<6:13:57,  1.33s/it]                                                       {'loss': 2.5575, 'learning_rate': 1.2742771943472058e-07, 'epoch': 11.63}
 73%|███████▎  | 44980/61904 [55:45<6:13:57,  1.33s/it] 73%|███████▎  | 44981/61904 [55:47<6:14:47,  1.33s/it] 73%|███████▎  | 44982/61904 [55:48<6:17:11,  1.34s/it] 73%|███████▎  | 44983/61904 [55:49<6:23:52,  1.36s/it] 73%|███████▎  | 44984/61904 [55:51<6:22:16,  1.36s/it] 73%|███████▎  | 44985/61904 [55:52<6:14:46,  1.33s/it] 73%|███████▎  | 44986/61904 [55:53<6:22:00,  1.35s/it] 73%|███████▎  | 44987/61904 [55:55<6:34:23,  1.40s/it] 73%|███████▎  | 44988/61904 [55:57<7:11:18,  1.53s/it] 73%|███████▎  | 44989/61904 [55:58<6:59:21,  1.49s/it] 73%|███████▎  | 44990/61904 [55:59<6:52:38,  1.46s/it] 73%|███████▎  | 44991/61904 [56:01<6:54:26,  1.47s/it] 73%|███████▎  | 44992/61904 [56:02<6:39:52,  1.42s/it] 73%|███████▎  | 44993/61904 [56:04<6:35:19,  1.40s/it] 73%|███████▎  | 44994/61904 [56:05<6:17:48,  1.34s/it] 73%|███████▎  | 44995/61904 [56:06<6:21:36,  1.35s/it] 73%|███████▎  | 44996/61904 [56:08<6:47:32,  1.45s/it] 73%|███████▎  | 44997/61904 [56:09<6:30:05,  1.38s/it] 73%|███████▎  | 44998/61904 [56:10<6:25:54,  1.37s/it] 73%|███████▎  | 44999/61904 [56:12<6:16:34,  1.34s/it] 73%|███████▎  | 45000/61904 [56:13<6:11:10,  1.32s/it]                                                       {'loss': 2.5079, 'learning_rate': 1.2739530662517827e-07, 'epoch': 11.63}
 73%|███████▎  | 45000/61904 [56:13<6:11:10,  1.32s/it] 73%|███████▎  | 45001/61904 [56:14<6:15:13,  1.33s/it] 73%|███████▎  | 45002/61904 [56:16<6:24:19,  1.36s/it] 73%|███████▎  | 45003/61904 [56:17<6:17:19,  1.34s/it] 73%|███████▎  | 45004/61904 [56:18<6:23:33,  1.36s/it] 73%|███████▎  | 45005/61904 [56:20<6:44:48,  1.44s/it] 73%|███████▎  | 45006/61904 [56:21<6:37:05,  1.41s/it] 73%|███████▎  | 45007/61904 [56:23<6:47:22,  1.45s/it] 73%|███████▎  | 45008/61904 [56:24<6:29:57,  1.38s/it] 73%|███████▎  | 45009/61904 [56:26<6:35:04,  1.40s/it] 73%|███████▎  | 45010/61904 [56:27<6:21:04,  1.35s/it] 73%|███████▎  | 45011/61904 [56:28<6:16:00,  1.34s/it] 73%|███████▎  | 45012/61904 [56:30<6:33:05,  1.40s/it] 73%|███████▎  | 45013/61904 [56:31<6:50:25,  1.46s/it] 73%|███████▎  | 45014/61904 [56:33<6:34:11,  1.40s/it] 73%|███████▎  | 45015/61904 [56:34<6:39:08,  1.42s/it] 73%|███████▎  | 45016/61904 [56:35<6:27:48,  1.38s/it] 73%|███████▎  | 45017/61904 [56:37<6:21:55,  1.36s/it] 73%|███████▎  | 45018/61904 [56:38<6:17:05,  1.34s/it] 73%|███████▎  | 45019/61904 [56:39<6:15:41,  1.33s/it] 73%|███████▎  | 45020/61904 [56:41<6:23:07,  1.36s/it]                                                       {'loss': 2.4868, 'learning_rate': 1.2736289381563593e-07, 'epoch': 11.64}
 73%|███████▎  | 45020/61904 [56:41<6:23:07,  1.36s/it] 73%|███████▎  | 45021/61904 [56:42<6:27:44,  1.38s/it] 73%|███████▎  | 45022/61904 [56:44<6:38:32,  1.42s/it] 73%|███████▎  | 45023/61904 [56:45<6:32:22,  1.39s/it] 73%|███████▎  | 45024/61904 [56:46<6:35:36,  1.41s/it] 73%|███████▎  | 45025/61904 [56:48<6:27:40,  1.38s/it] 73%|███████▎  | 45026/61904 [56:49<6:40:04,  1.42s/it] 73%|███████▎  | 45027/61904 [56:51<6:45:08,  1.44s/it] 73%|███████▎  | 45028/61904 [56:52<6:37:30,  1.41s/it] 73%|███████▎  | 45029/61904 [56:53<6:29:08,  1.38s/it] 73%|███████▎  | 45030/61904 [56:55<6:30:06,  1.39s/it] 73%|███████▎  | 45031/61904 [56:56<6:30:14,  1.39s/it] 73%|███████▎  | 45032/61904 [56:58<6:30:37,  1.39s/it] 73%|███████▎  | 45033/61904 [56:59<6:30:46,  1.39s/it] 73%|███████▎  | 45034/61904 [57:00<6:28:39,  1.38s/it] 73%|███████▎  | 45035/61904 [57:02<6:33:24,  1.40s/it] 73%|███████▎  | 45036/61904 [57:04<7:05:52,  1.51s/it] 73%|███████▎  | 45037/61904 [57:05<6:52:31,  1.47s/it] 73%|███████▎  | 45038/61904 [57:06<6:59:03,  1.49s/it] 73%|███████▎  | 45039/61904 [57:08<6:45:05,  1.44s/it] 73%|███████▎  | 45040/61904 [57:09<6:50:06,  1.46s/it]                                                       {'loss': 2.4547, 'learning_rate': 1.273304810060936e-07, 'epoch': 11.64}
 73%|███████▎  | 45040/61904 [57:09<6:50:06,  1.46s/it] 73%|███████▎  | 45041/61904 [57:11<6:32:38,  1.40s/it] 73%|███████▎  | 45042/61904 [57:12<6:33:35,  1.40s/it] 73%|███████▎  | 45043/61904 [57:14<6:55:33,  1.48s/it] 73%|███████▎  | 45044/61904 [57:15<6:42:27,  1.43s/it] 73%|███████▎  | 45045/61904 [57:16<6:35:16,  1.41s/it] 73%|███████▎  | 45046/61904 [57:18<6:44:31,  1.44s/it] 73%|███████▎  | 45047/61904 [57:19<6:49:49,  1.46s/it] 73%|███████▎  | 45048/61904 [57:21<6:36:03,  1.41s/it] 73%|███████▎  | 45049/61904 [57:22<6:19:43,  1.35s/it] 73%|███████▎  | 45050/61904 [57:23<6:36:58,  1.41s/it] 73%|███████▎  | 45051/61904 [57:25<6:28:40,  1.38s/it] 73%|███████▎  | 45052/61904 [57:26<6:29:41,  1.39s/it] 73%|███████▎  | 45053/61904 [57:27<6:26:43,  1.38s/it] 73%|███████▎  | 45054/61904 [57:29<6:32:57,  1.40s/it] 73%|███████▎  | 45055/61904 [57:30<6:24:52,  1.37s/it] 73%|███████▎  | 45056/61904 [57:32<6:23:38,  1.37s/it] 73%|███████▎  | 45057/61904 [57:33<6:26:46,  1.38s/it] 73%|███████▎  | 45058/61904 [57:34<6:34:17,  1.40s/it] 73%|███████▎  | 45059/61904 [57:36<6:32:19,  1.40s/it] 73%|███████▎  | 45060/61904 [57:37<6:40:36,  1.43s/it]                                                       {'loss': 2.4594, 'learning_rate': 1.2729806819655126e-07, 'epoch': 11.65}
 73%|███████▎  | 45060/61904 [57:37<6:40:36,  1.43s/it] 73%|███████▎  | 45061/61904 [57:39<6:49:51,  1.46s/it] 73%|███████▎  | 45062/61904 [57:40<6:42:13,  1.43s/it] 73%|███████▎  | 45063/61904 [57:42<6:55:49,  1.48s/it] 73%|███████▎  | 45064/61904 [57:43<6:45:43,  1.45s/it] 73%|███████▎  | 45065/61904 [57:44<6:33:54,  1.40s/it] 73%|███████▎  | 45066/61904 [57:46<6:36:41,  1.41s/it] 73%|███████▎  | 45067/61904 [57:47<6:26:21,  1.38s/it] 73%|███████▎  | 45068/61904 [57:49<6:37:10,  1.42s/it] 73%|███████▎  | 45069/61904 [57:50<6:40:02,  1.43s/it] 73%|███████▎  | 45070/61904 [57:51<6:30:07,  1.39s/it] 73%|███████▎  | 45071/61904 [57:53<6:27:29,  1.38s/it] 73%|███████▎  | 45072/61904 [57:54<6:19:23,  1.35s/it] 73%|███████▎  | 45073/61904 [57:55<6:17:28,  1.35s/it] 73%|███████▎  | 45074/61904 [57:57<6:17:53,  1.35s/it] 73%|███████▎  | 45075/61904 [57:58<6:13:50,  1.33s/it] 73%|███████▎  | 45076/61904 [57:59<6:20:26,  1.36s/it] 73%|███████▎  | 45077/61904 [58:01<6:13:38,  1.33s/it] 73%|███████▎  | 45078/61904 [58:02<6:23:01,  1.37s/it] 73%|███████▎  | 45079/61904 [58:04<6:21:35,  1.36s/it] 73%|███████▎  | 45080/61904 [58:05<6:16:51,  1.34s/it]                                                       {'loss': 2.495, 'learning_rate': 1.2726565538700895e-07, 'epoch': 11.65}
 73%|███████▎  | 45080/61904 [58:05<6:16:51,  1.34s/it] 73%|███████▎  | 45081/61904 [58:06<6:14:58,  1.34s/it] 73%|███████▎  | 45082/61904 [58:08<6:35:54,  1.41s/it] 73%|███████▎  | 45083/61904 [58:09<6:36:54,  1.42s/it] 73%|███████▎  | 45084/61904 [58:11<6:37:03,  1.42s/it] 73%|███████▎  | 45085/61904 [58:12<6:34:01,  1.41s/it] 73%|███████▎  | 45086/61904 [58:13<6:30:42,  1.39s/it] 73%|███████▎  | 45087/61904 [58:15<6:36:14,  1.41s/it] 73%|███████▎  | 45088/61904 [58:16<6:31:13,  1.40s/it] 73%|███████▎  | 45089/61904 [58:17<6:20:50,  1.36s/it] 73%|███████▎  | 45090/61904 [58:19<6:23:39,  1.37s/it] 73%|███████▎  | 45091/61904 [58:20<6:18:26,  1.35s/it] 73%|███████▎  | 45092/61904 [58:22<6:22:17,  1.36s/it] 73%|███████▎  | 45093/61904 [58:23<6:36:41,  1.42s/it] 73%|███████▎  | 45094/61904 [58:24<6:35:30,  1.41s/it] 73%|███████▎  | 45095/61904 [58:26<6:39:45,  1.43s/it] 73%|███████▎  | 45096/61904 [58:27<6:34:02,  1.41s/it] 73%|███████▎  | 45097/61904 [58:29<6:28:59,  1.39s/it] 73%|███████▎  | 45098/61904 [58:30<6:29:24,  1.39s/it] 73%|███████▎  | 45099/61904 [58:31<6:25:02,  1.37s/it] 73%|███████▎  | 45100/61904 [58:33<6:25:39,  1.38s/it]                                                       {'loss': 2.5174, 'learning_rate': 1.272332425774666e-07, 'epoch': 11.66}
 73%|███████▎  | 45100/61904 [58:33<6:25:39,  1.38s/it] 73%|███████▎  | 45101/61904 [58:34<6:38:03,  1.42s/it] 73%|███████▎  | 45102/61904 [58:36<6:32:41,  1.40s/it] 73%|███████▎  | 45103/61904 [58:37<6:33:49,  1.41s/it] 73%|███████▎  | 45104/61904 [58:38<6:23:38,  1.37s/it] 73%|███████▎  | 45105/61904 [58:40<6:11:34,  1.33s/it] 73%|███████▎  | 45106/61904 [58:41<6:22:46,  1.37s/it] 73%|███████▎  | 45107/61904 [58:42<6:23:40,  1.37s/it] 73%|███████▎  | 45108/61904 [58:44<6:27:19,  1.38s/it] 73%|███████▎  | 45109/61904 [58:45<6:26:28,  1.38s/it] 73%|███████▎  | 45110/61904 [58:47<6:31:46,  1.40s/it] 73%|███████▎  | 45111/61904 [58:48<6:29:27,  1.39s/it] 73%|███████▎  | 45112/61904 [58:49<6:19:41,  1.36s/it] 73%|███████▎  | 45113/61904 [58:51<6:11:57,  1.33s/it] 73%|███████▎  | 45114/61904 [58:52<6:18:39,  1.35s/it] 73%|███████▎  | 45115/61904 [58:53<6:23:10,  1.37s/it] 73%|███████▎  | 45116/61904 [58:55<6:31:42,  1.40s/it] 73%|███████▎  | 45117/61904 [58:56<6:43:39,  1.44s/it] 73%|███████▎  | 45118/61904 [58:58<6:31:30,  1.40s/it] 73%|███████▎  | 45119/61904 [58:59<6:29:17,  1.39s/it] 73%|███████▎  | 45120/61904 [59:00<6:20:59,  1.36s/it]                                                       {'loss': 2.4223, 'learning_rate': 1.2720082976792427e-07, 'epoch': 11.66}
 73%|███████▎  | 45120/61904 [59:00<6:20:59,  1.36s/it] 73%|███████▎  | 45121/61904 [59:02<6:15:50,  1.34s/it] 73%|███████▎  | 45122/61904 [59:03<6:17:35,  1.35s/it] 73%|███████▎  | 45123/61904 [59:04<6:11:53,  1.33s/it] 73%|███████▎  | 45124/61904 [59:06<6:22:01,  1.37s/it] 73%|███████▎  | 45125/61904 [59:07<6:32:29,  1.40s/it] 73%|███████▎  | 45126/61904 [59:09<6:32:13,  1.40s/it] 73%|███████▎  | 45127/61904 [59:10<6:31:45,  1.40s/it] 73%|███████▎  | 45128/61904 [59:11<6:36:05,  1.42s/it] 73%|███████▎  | 45129/61904 [59:13<6:33:50,  1.41s/it] 73%|███████▎  | 45130/61904 [59:14<6:32:02,  1.40s/it] 73%|███████▎  | 45131/61904 [59:16<6:39:34,  1.43s/it] 73%|███████▎  | 45132/61904 [59:17<6:26:05,  1.38s/it] 73%|███████▎  | 45133/61904 [59:18<6:16:13,  1.35s/it] 73%|███████▎  | 45134/61904 [59:20<6:08:12,  1.32s/it] 73%|███████▎  | 45135/61904 [59:21<6:03:18,  1.30s/it] 73%|███████▎  | 45136/61904 [59:22<6:08:04,  1.32s/it] 73%|███████▎  | 45137/61904 [59:24<6:12:49,  1.33s/it] 73%|███████▎  | 45138/61904 [59:25<6:14:41,  1.34s/it] 73%|███████▎  | 45139/61904 [59:26<6:25:11,  1.38s/it] 73%|███████▎  | 45140/61904 [59:28<6:37:16,  1.42s/it]                                                       {'loss': 2.4523, 'learning_rate': 1.2716841695838196e-07, 'epoch': 11.67}
 73%|███████▎  | 45140/61904 [59:28<6:37:16,  1.42s/it] 73%|███████▎  | 45141/61904 [59:29<6:52:52,  1.48s/it] 73%|███████▎  | 45142/61904 [59:31<6:34:54,  1.41s/it] 73%|███████▎  | 45143/61904 [59:32<6:37:06,  1.42s/it] 73%|███████▎  | 45144/61904 [59:34<6:37:03,  1.42s/it] 73%|███████▎  | 45145/61904 [59:35<6:27:50,  1.39s/it] 73%|███████▎  | 45146/61904 [59:36<6:25:38,  1.38s/it] 73%|███████▎  | 45147/61904 [59:38<6:31:51,  1.40s/it] 73%|███████▎  | 45148/61904 [59:39<6:29:01,  1.39s/it] 73%|███████▎  | 45149/61904 [59:40<6:26:04,  1.38s/it] 73%|███████▎  | 45150/61904 [59:42<6:29:57,  1.40s/it] 73%|███████▎  | 45151/61904 [59:43<6:39:28,  1.43s/it] 73%|███████▎  | 45152/61904 [59:45<6:38:04,  1.43s/it] 73%|███████▎  | 45153/61904 [59:46<6:25:48,  1.38s/it] 73%|███████▎  | 45154/61904 [59:48<6:34:05,  1.41s/it] 73%|███████▎  | 45155/61904 [59:49<6:33:06,  1.41s/it] 73%|███████▎  | 45156/61904 [59:50<6:27:27,  1.39s/it] 73%|███████▎  | 45157/61904 [59:52<6:16:31,  1.35s/it] 73%|███████▎  | 45158/61904 [59:53<6:15:09,  1.34s/it] 73%|███████▎  | 45159/61904 [59:54<6:12:07,  1.33s/it] 73%|███████▎  | 45160/61904 [59:55<6:06:53,  1.31s/it]                                                       {'loss': 2.4271, 'learning_rate': 1.2713600414883962e-07, 'epoch': 11.67}
 73%|███████▎  | 45160/61904 [59:55<6:06:53,  1.31s/it] 73%|███████▎  | 45161/61904 [59:57<6:13:10,  1.34s/it] 73%|███████▎  | 45162/61904 [59:58<6:14:30,  1.34s/it] 73%|███████▎  | 45163/61904 [59:59<6:04:17,  1.31s/it] 73%|███████▎  | 45164/61904 [1:00:01<6:03:51,  1.30s/it] 73%|███████▎  | 45165/61904 [1:00:02<6:06:01,  1.31s/it] 73%|███████▎  | 45166/61904 [1:00:03<6:06:17,  1.31s/it] 73%|███████▎  | 45167/61904 [1:00:05<6:04:32,  1.31s/it] 73%|███████▎  | 45168/61904 [1:00:06<6:07:17,  1.32s/it] 73%|███████▎  | 45169/61904 [1:00:07<6:16:15,  1.35s/it] 73%|███████▎  | 45170/61904 [1:00:09<6:11:40,  1.33s/it] 73%|███████▎  | 45171/61904 [1:00:10<6:19:59,  1.36s/it] 73%|███████▎  | 45172/61904 [1:00:12<6:24:58,  1.38s/it] 73%|███████▎  | 45173/61904 [1:00:13<6:17:49,  1.35s/it] 73%|███████▎  | 45174/61904 [1:00:14<6:12:31,  1.34s/it] 73%|███████▎  | 45175/61904 [1:00:16<6:12:37,  1.34s/it] 73%|███████▎  | 45176/61904 [1:00:17<6:15:55,  1.35s/it] 73%|███████▎  | 45177/61904 [1:00:18<6:10:51,  1.33s/it] 73%|███████▎  | 45178/61904 [1:00:19<6:03:05,  1.30s/it] 73%|███████▎  | 45179/61904 [1:00:21<6:07:23,  1.32s/it] 73%|███████▎  | 45180/61904 [1:00:22<6:09:01,  1.32s/it]                                                         {'loss': 2.5235, 'learning_rate': 1.2710359133929728e-07, 'epoch': 11.68}
 73%|███████▎  | 45180/61904 [1:00:22<6:09:01,  1.32s/it] 73%|███████▎  | 45181/61904 [1:00:23<6:07:31,  1.32s/it] 73%|███████▎  | 45182/61904 [1:00:25<6:05:17,  1.31s/it] 73%|███████▎  | 45183/61904 [1:00:26<6:23:11,  1.37s/it] 73%|███████▎  | 45184/61904 [1:00:28<6:21:16,  1.37s/it] 73%|███████▎  | 45185/61904 [1:00:29<6:29:27,  1.40s/it] 73%|███████▎  | 45186/61904 [1:00:31<6:41:32,  1.44s/it] 73%|███████▎  | 45187/61904 [1:00:32<6:36:29,  1.42s/it] 73%|███████▎  | 45188/61904 [1:00:33<6:30:03,  1.40s/it] 73%|███████▎  | 45189/61904 [1:00:35<6:26:06,  1.39s/it] 73%|███████▎  | 45190/61904 [1:00:36<6:16:34,  1.35s/it] 73%|███████▎  | 45191/61904 [1:00:37<6:18:06,  1.36s/it] 73%|███████▎  | 45192/61904 [1:00:39<6:24:45,  1.38s/it] 73%|███████▎  | 45193/61904 [1:00:40<6:27:18,  1.39s/it] 73%|███████▎  | 45194/61904 [1:00:42<6:30:34,  1.40s/it] 73%|███████▎  | 45195/61904 [1:00:43<6:30:10,  1.40s/it] 73%|███████▎  | 45196/61904 [1:00:44<6:18:45,  1.36s/it] 73%|███████▎  | 45197/61904 [1:00:46<6:17:28,  1.36s/it] 73%|███████▎  | 45198/61904 [1:00:47<6:25:31,  1.38s/it] 73%|███████▎  | 45199/61904 [1:00:48<6:18:18,  1.36s/it] 73%|███████▎  | 45200/61904 [1:00:50<6:12:33,  1.34s/it]                                                         {'loss': 2.4666, 'learning_rate': 1.2707117852975494e-07, 'epoch': 11.68}
 73%|███████▎  | 45200/61904 [1:00:50<6:12:33,  1.34s/it] 73%|███████▎  | 45201/61904 [1:00:51<6:14:23,  1.34s/it] 73%|███████▎  | 45202/61904 [1:00:52<6:11:25,  1.33s/it] 73%|███████▎  | 45203/61904 [1:00:54<6:17:31,  1.36s/it] 73%|███████▎  | 45204/61904 [1:00:55<6:09:51,  1.33s/it] 73%|███████▎  | 45205/61904 [1:00:57<6:56:35,  1.50s/it] 73%|███████▎  | 45206/61904 [1:00:58<6:40:46,  1.44s/it] 73%|███████▎  | 45207/61904 [1:00:59<6:30:14,  1.40s/it] 73%|███████▎  | 45208/61904 [1:01:01<6:26:12,  1.39s/it] 73%|███████▎  | 45209/61904 [1:01:02<6:27:05,  1.39s/it] 73%|███████▎  | 45210/61904 [1:01:03<6:16:03,  1.35s/it] 73%|███████▎  | 45211/61904 [1:01:05<6:25:36,  1.39s/it] 73%|███████▎  | 45212/61904 [1:01:06<6:18:47,  1.36s/it] 73%|███████▎  | 45213/61904 [1:01:08<6:21:30,  1.37s/it] 73%|███████▎  | 45214/61904 [1:01:09<6:20:42,  1.37s/it] 73%|███████▎  | 45215/61904 [1:01:10<6:03:56,  1.31s/it] 73%|███████▎  | 45216/61904 [1:01:11<5:58:11,  1.29s/it] 73%|███████▎  | 45217/61904 [1:01:13<5:57:22,  1.29s/it] 73%|███████▎  | 45218/61904 [1:01:14<6:08:50,  1.33s/it] 73%|███████▎  | 45219/61904 [1:01:15<6:06:52,  1.32s/it] 73%|███████▎  | 45220/61904 [1:01:17<6:13:10,  1.34s/it]                                                         {'loss': 2.4413, 'learning_rate': 1.2703876572021263e-07, 'epoch': 11.69}
 73%|███████▎  | 45220/61904 [1:01:17<6:13:10,  1.34s/it] 73%|███████▎  | 45221/61904 [1:01:18<6:17:47,  1.36s/it] 73%|███████▎  | 45222/61904 [1:01:20<6:11:01,  1.33s/it] 73%|███████▎  | 45223/61904 [1:01:21<6:18:40,  1.36s/it] 73%|███████▎  | 45224/61904 [1:01:22<6:27:04,  1.39s/it] 73%|███████▎  | 45225/61904 [1:01:24<6:19:20,  1.36s/it] 73%|███████▎  | 45226/61904 [1:01:25<6:11:40,  1.34s/it] 73%|███████▎  | 45227/61904 [1:01:26<6:03:29,  1.31s/it] 73%|███████▎  | 45228/61904 [1:01:27<6:00:21,  1.30s/it] 73%|███████▎  | 45229/61904 [1:01:29<6:05:07,  1.31s/it] 73%|███████▎  | 45230/61904 [1:01:30<6:15:53,  1.35s/it] 73%|███████▎  | 45231/61904 [1:01:32<6:19:40,  1.37s/it] 73%|███████▎  | 45232/61904 [1:01:33<6:20:52,  1.37s/it] 73%|███████▎  | 45233/61904 [1:01:34<6:15:49,  1.35s/it] 73%|███████▎  | 45234/61904 [1:01:36<6:10:09,  1.33s/it] 73%|███████▎  | 45235/61904 [1:01:37<6:13:40,  1.35s/it] 73%|███████▎  | 45236/61904 [1:01:39<6:27:58,  1.40s/it] 73%|███████▎  | 45237/61904 [1:01:40<6:22:35,  1.38s/it] 73%|███████▎  | 45238/61904 [1:01:41<6:26:54,  1.39s/it] 73%|███████▎  | 45239/61904 [1:01:43<6:28:39,  1.40s/it] 73%|███████▎  | 45240/61904 [1:01:44<6:26:33,  1.39s/it]                                                         {'loss': 2.422, 'learning_rate': 1.270063529106703e-07, 'epoch': 11.69}
 73%|███████▎  | 45240/61904 [1:01:44<6:26:33,  1.39s/it] 73%|███████▎  | 45241/61904 [1:01:45<6:09:25,  1.33s/it] 73%|███████▎  | 45242/61904 [1:01:47<6:18:00,  1.36s/it] 73%|███████▎  | 45243/61904 [1:01:48<6:23:34,  1.38s/it] 73%|███████▎  | 45244/61904 [1:01:50<6:30:24,  1.41s/it] 73%|███████▎  | 45245/61904 [1:01:51<6:24:40,  1.39s/it] 73%|███████▎  | 45246/61904 [1:01:52<6:16:07,  1.35s/it] 73%|███████▎  | 45247/61904 [1:01:54<6:22:02,  1.38s/it] 73%|███████▎  | 45248/61904 [1:01:55<6:22:46,  1.38s/it] 73%|███████▎  | 45249/61904 [1:01:56<6:21:18,  1.37s/it] 73%|███████▎  | 45250/61904 [1:01:58<6:10:06,  1.33s/it] 73%|███████▎  | 45251/61904 [1:01:59<6:18:15,  1.36s/it] 73%|███████▎  | 45252/61904 [1:02:00<6:14:27,  1.35s/it] 73%|███████▎  | 45253/61904 [1:02:02<6:11:57,  1.34s/it] 73%|███████▎  | 45254/61904 [1:02:03<6:29:31,  1.40s/it] 73%|███████▎  | 45255/61904 [1:02:05<6:22:03,  1.38s/it] 73%|███████▎  | 45256/61904 [1:02:06<6:31:26,  1.41s/it] 73%|███████▎  | 45257/61904 [1:02:08<6:34:09,  1.42s/it] 73%|███████▎  | 45258/61904 [1:02:09<6:27:18,  1.40s/it] 73%|███████▎  | 45259/61904 [1:02:10<6:19:11,  1.37s/it] 73%|███████▎  | 45260/61904 [1:02:11<6:14:35,  1.35s/it]                                                         {'loss': 2.5057, 'learning_rate': 1.2697394010112796e-07, 'epoch': 11.7}
 73%|███████▎  | 45260/61904 [1:02:11<6:14:35,  1.35s/it] 73%|███████▎  | 45261/61904 [1:02:13<6:14:58,  1.35s/it] 73%|███████▎  | 45262/61904 [1:02:14<6:17:30,  1.36s/it] 73%|███████▎  | 45263/61904 [1:02:16<6:22:41,  1.38s/it] 73%|███████▎  | 45264/61904 [1:02:17<6:10:44,  1.34s/it] 73%|███████▎  | 45265/61904 [1:02:18<6:16:17,  1.36s/it] 73%|███████▎  | 45266/61904 [1:02:20<6:08:30,  1.33s/it] 73%|███████▎  | 45267/61904 [1:02:21<6:11:39,  1.34s/it] 73%|███████▎  | 45268/61904 [1:02:22<6:03:47,  1.31s/it] 73%|███████▎  | 45269/61904 [1:02:24<6:16:18,  1.36s/it] 73%|███████▎  | 45270/61904 [1:02:25<6:15:19,  1.35s/it] 73%|███████▎  | 45271/61904 [1:02:26<6:07:52,  1.33s/it] 73%|███████▎  | 45272/61904 [1:02:28<6:10:33,  1.34s/it] 73%|███████▎  | 45273/61904 [1:02:29<6:14:23,  1.35s/it] 73%|███████▎  | 45274/61904 [1:02:30<6:12:33,  1.34s/it] 73%|███████▎  | 45275/61904 [1:02:32<6:16:11,  1.36s/it] 73%|███████▎  | 45276/61904 [1:02:33<6:19:07,  1.37s/it] 73%|███████▎  | 45277/61904 [1:02:34<6:16:57,  1.36s/it] 73%|███████▎  | 45278/61904 [1:02:36<6:29:56,  1.41s/it] 73%|███████▎  | 45279/61904 [1:02:37<6:28:14,  1.40s/it] 73%|███████▎  | 45280/61904 [1:02:39<6:14:19,  1.35s/it]                                                         {'loss': 2.5153, 'learning_rate': 1.2694152729158562e-07, 'epoch': 11.7}
 73%|███████▎  | 45280/61904 [1:02:39<6:14:19,  1.35s/it] 73%|███████▎  | 45281/61904 [1:02:40<6:18:48,  1.37s/it] 73%|███████▎  | 45282/61904 [1:02:41<6:13:11,  1.35s/it] 73%|███████▎  | 45283/61904 [1:02:43<6:22:33,  1.38s/it] 73%|███████▎  | 45284/61904 [1:02:44<6:13:15,  1.35s/it] 73%|███████▎  | 45285/61904 [1:02:45<6:19:20,  1.37s/it] 73%|███████▎  | 45286/61904 [1:02:47<6:13:04,  1.35s/it] 73%|███████▎  | 45287/61904 [1:02:48<6:16:43,  1.36s/it] 73%|███████▎  | 45288/61904 [1:02:49<6:18:46,  1.37s/it] 73%|███████▎  | 45289/61904 [1:02:51<6:11:23,  1.34s/it] 73%|███████▎  | 45290/61904 [1:02:52<6:06:40,  1.32s/it] 73%|███████▎  | 45291/61904 [1:02:53<6:13:00,  1.35s/it] 73%|███████▎  | 45292/61904 [1:02:55<6:10:10,  1.34s/it] 73%|███████▎  | 45293/61904 [1:02:56<6:15:43,  1.36s/it] 73%|███████▎  | 45294/61904 [1:02:58<6:18:09,  1.37s/it] 73%|███████▎  | 45295/61904 [1:02:59<6:20:13,  1.37s/it] 73%|███████▎  | 45296/61904 [1:03:00<6:14:39,  1.35s/it] 73%|███████▎  | 45297/61904 [1:03:02<6:18:31,  1.37s/it] 73%|███████▎  | 45298/61904 [1:03:03<6:22:21,  1.38s/it] 73%|███████▎  | 45299/61904 [1:03:04<6:15:47,  1.36s/it] 73%|███████▎  | 45300/61904 [1:03:06<6:14:33,  1.35s/it]                                                         {'loss': 2.4894, 'learning_rate': 1.269091144820433e-07, 'epoch': 11.71}
 73%|███████▎  | 45300/61904 [1:03:06<6:14:33,  1.35s/it] 73%|███████▎  | 45301/61904 [1:03:07<6:36:24,  1.43s/it] 73%|███████▎  | 45302/61904 [1:03:09<6:51:19,  1.49s/it] 73%|███████▎  | 45303/61904 [1:03:10<6:30:01,  1.41s/it] 73%|███████▎  | 45304/61904 [1:03:12<6:37:03,  1.44s/it] 73%|███████▎  | 45305/61904 [1:03:13<6:46:04,  1.47s/it] 73%|███████▎  | 45306/61904 [1:03:15<6:33:29,  1.42s/it] 73%|███████▎  | 45307/61904 [1:03:16<6:38:49,  1.44s/it] 73%|███████▎  | 45308/61904 [1:03:17<6:31:37,  1.42s/it] 73%|███████▎  | 45309/61904 [1:03:19<6:24:39,  1.39s/it] 73%|███████▎  | 45310/61904 [1:03:20<6:24:28,  1.39s/it] 73%|███████▎  | 45311/61904 [1:03:21<6:23:52,  1.39s/it] 73%|███████▎  | 45312/61904 [1:03:23<6:29:09,  1.41s/it] 73%|███████▎  | 45313/61904 [1:03:24<6:18:42,  1.37s/it] 73%|███████▎  | 45314/61904 [1:03:26<6:19:06,  1.37s/it] 73%|███████▎  | 45315/61904 [1:03:27<6:11:23,  1.34s/it] 73%|███████▎  | 45316/61904 [1:03:28<6:22:26,  1.38s/it] 73%|███████▎  | 45317/61904 [1:03:30<6:23:21,  1.39s/it] 73%|███████▎  | 45318/61904 [1:03:31<6:13:19,  1.35s/it] 73%|███████▎  | 45319/61904 [1:03:32<6:22:46,  1.38s/it] 73%|███████▎  | 45320/61904 [1:03:34<6:20:48,  1.38s/it]                                                         {'loss': 2.5211, 'learning_rate': 1.2687670167250097e-07, 'epoch': 11.71}
 73%|███████▎  | 45320/61904 [1:03:34<6:20:48,  1.38s/it] 73%|███████▎  | 45321/61904 [1:03:35<6:35:43,  1.43s/it] 73%|███████▎  | 45322/61904 [1:03:37<6:39:16,  1.44s/it] 73%|███████▎  | 45323/61904 [1:03:38<6:48:26,  1.48s/it] 73%|███████▎  | 45324/61904 [1:03:40<6:44:35,  1.46s/it] 73%|███████▎  | 45325/61904 [1:03:41<6:48:58,  1.48s/it] 73%|███████▎  | 45326/61904 [1:03:43<6:56:03,  1.51s/it] 73%|███████▎  | 45327/61904 [1:03:44<6:42:09,  1.46s/it] 73%|███████▎  | 45328/61904 [1:03:46<6:28:14,  1.41s/it] 73%|███████▎  | 45329/61904 [1:03:47<6:26:36,  1.40s/it] 73%|███████▎  | 45330/61904 [1:03:48<6:13:27,  1.35s/it] 73%|███████▎  | 45331/61904 [1:03:50<6:13:06,  1.35s/it] 73%|███████▎  | 45332/61904 [1:03:51<6:15:12,  1.36s/it] 73%|███████▎  | 45333/61904 [1:03:52<6:24:28,  1.39s/it] 73%|███████▎  | 45334/61904 [1:03:54<6:26:22,  1.40s/it] 73%|███████▎  | 45335/61904 [1:03:55<6:23:27,  1.39s/it] 73%|███████▎  | 45336/61904 [1:03:56<6:16:34,  1.36s/it] 73%|███████▎  | 45337/61904 [1:03:58<6:10:06,  1.34s/it] 73%|███████▎  | 45338/61904 [1:03:59<6:21:45,  1.38s/it] 73%|███████▎  | 45339/61904 [1:04:01<6:23:02,  1.39s/it] 73%|███████▎  | 45340/61904 [1:04:02<6:43:54,  1.46s/it]                                                         {'loss': 2.4449, 'learning_rate': 1.2684428886295863e-07, 'epoch': 11.72}
 73%|███████▎  | 45340/61904 [1:04:02<6:43:54,  1.46s/it] 73%|███████▎  | 45341/61904 [1:04:04<6:34:24,  1.43s/it] 73%|███████▎  | 45342/61904 [1:04:05<6:22:37,  1.39s/it] 73%|███████▎  | 45343/61904 [1:04:06<6:30:16,  1.41s/it] 73%|███████▎  | 45344/61904 [1:04:08<6:36:01,  1.43s/it] 73%|███████▎  | 45345/61904 [1:04:09<6:43:56,  1.46s/it] 73%|███████▎  | 45346/61904 [1:04:11<6:40:18,  1.45s/it] 73%|███████▎  | 45347/61904 [1:04:12<6:31:38,  1.42s/it] 73%|███████▎  | 45348/61904 [1:04:13<6:21:00,  1.38s/it] 73%|███████▎  | 45349/61904 [1:04:15<6:26:38,  1.40s/it] 73%|███████▎  | 45350/61904 [1:04:16<6:29:33,  1.41s/it] 73%|███████▎  | 45351/61904 [1:04:18<6:21:35,  1.38s/it] 73%|███████▎  | 45352/61904 [1:04:19<6:12:32,  1.35s/it] 73%|███████▎  | 45353/61904 [1:04:21<6:34:00,  1.43s/it] 73%|███████▎  | 45354/61904 [1:04:22<6:24:11,  1.39s/it] 73%|███████▎  | 45355/61904 [1:04:23<6:22:29,  1.39s/it] 73%|███████▎  | 45356/61904 [1:04:25<6:36:37,  1.44s/it] 73%|███████▎  | 45357/61904 [1:04:26<6:27:23,  1.40s/it] 73%|███████▎  | 45358/61904 [1:04:27<6:23:38,  1.39s/it] 73%|███████▎  | 45359/61904 [1:04:29<6:48:09,  1.48s/it] 73%|███████▎  | 45360/61904 [1:04:31<6:43:39,  1.46s/it]                                                         {'loss': 2.4859, 'learning_rate': 1.268118760534163e-07, 'epoch': 11.72}
 73%|███████▎  | 45360/61904 [1:04:31<6:43:39,  1.46s/it] 73%|███████▎  | 45361/61904 [1:04:32<6:31:43,  1.42s/it] 73%|███████▎  | 45362/61904 [1:04:33<6:34:16,  1.43s/it] 73%|███████▎  | 45363/61904 [1:04:35<6:28:15,  1.41s/it] 73%|███████▎  | 45364/61904 [1:04:36<6:21:44,  1.38s/it] 73%|███████▎  | 45365/61904 [1:04:38<6:34:56,  1.43s/it] 73%|███████▎  | 45366/61904 [1:04:39<6:23:01,  1.39s/it] 73%|███████▎  | 45367/61904 [1:04:40<6:16:08,  1.36s/it] 73%|███████▎  | 45368/61904 [1:04:42<6:28:01,  1.41s/it] 73%|███████▎  | 45369/61904 [1:04:43<6:51:08,  1.49s/it] 73%|███████▎  | 45370/61904 [1:04:45<6:38:00,  1.44s/it] 73%|███████▎  | 45371/61904 [1:04:46<6:18:34,  1.37s/it] 73%|███████▎  | 45372/61904 [1:04:47<6:22:15,  1.39s/it] 73%|███████▎  | 45373/61904 [1:04:49<6:29:30,  1.41s/it] 73%|███████▎  | 45374/61904 [1:04:50<6:21:01,  1.38s/it] 73%|███████▎  | 45375/61904 [1:04:51<6:19:23,  1.38s/it] 73%|███████▎  | 45376/61904 [1:04:53<6:16:31,  1.37s/it] 73%|███████▎  | 45377/61904 [1:04:54<6:05:33,  1.33s/it] 73%|███████▎  | 45378/61904 [1:04:55<6:08:34,  1.34s/it] 73%|███████▎  | 45379/61904 [1:04:57<6:18:39,  1.37s/it] 73%|███████▎  | 45380/61904 [1:04:58<6:18:48,  1.38s/it]                                                         {'loss': 2.4578, 'learning_rate': 1.2677946324387398e-07, 'epoch': 11.73}
 73%|███████▎  | 45380/61904 [1:04:58<6:18:48,  1.38s/it] 73%|███████▎  | 45381/61904 [1:05:00<6:17:04,  1.37s/it] 73%|███████▎  | 45382/61904 [1:05:01<6:10:31,  1.35s/it] 73%|███████▎  | 45383/61904 [1:05:02<6:07:14,  1.33s/it] 73%|███████▎  | 45384/61904 [1:05:04<6:07:04,  1.33s/it] 73%|███████▎  | 45385/61904 [1:05:05<6:17:36,  1.37s/it] 73%|███████▎  | 45386/61904 [1:05:06<6:20:58,  1.38s/it] 73%|███████▎  | 45387/61904 [1:05:08<6:22:12,  1.39s/it] 73%|███████▎  | 45388/61904 [1:05:09<6:27:45,  1.41s/it] 73%|███████▎  | 45389/61904 [1:05:11<6:33:44,  1.43s/it] 73%|███████▎  | 45390/61904 [1:05:12<6:34:45,  1.43s/it] 73%|███████▎  | 45391/61904 [1:05:14<6:44:13,  1.47s/it] 73%|███████▎  | 45392/61904 [1:05:15<6:40:57,  1.46s/it] 73%|███████▎  | 45393/61904 [1:05:17<6:38:32,  1.45s/it] 73%|███████▎  | 45394/61904 [1:05:18<6:38:23,  1.45s/it] 73%|███████▎  | 45395/61904 [1:05:19<6:31:09,  1.42s/it] 73%|███████▎  | 45396/61904 [1:05:21<6:38:32,  1.45s/it] 73%|███████▎  | 45397/61904 [1:05:22<6:31:25,  1.42s/it] 73%|███████▎  | 45398/61904 [1:05:24<6:24:17,  1.40s/it] 73%|███████▎  | 45399/61904 [1:05:25<6:19:25,  1.38s/it] 73%|███████▎  | 45400/61904 [1:05:26<6:14:19,  1.36s/it]                                                         {'loss': 2.4715, 'learning_rate': 1.2674705043433164e-07, 'epoch': 11.73}
 73%|███████▎  | 45400/61904 [1:05:26<6:14:19,  1.36s/it] 73%|███████▎  | 45401/61904 [1:05:28<6:19:18,  1.38s/it] 73%|███████▎  | 45402/61904 [1:05:29<6:17:52,  1.37s/it] 73%|███████▎  | 45403/61904 [1:05:30<6:08:35,  1.34s/it] 73%|███████▎  | 45404/61904 [1:05:32<6:09:41,  1.34s/it] 73%|███████▎  | 45405/61904 [1:05:33<6:19:38,  1.38s/it] 73%|███████▎  | 45406/61904 [1:05:35<6:20:55,  1.39s/it] 73%|███████▎  | 45407/61904 [1:05:36<6:15:32,  1.37s/it] 73%|███████▎  | 45408/61904 [1:05:37<6:07:56,  1.34s/it] 73%|███████▎  | 45409/61904 [1:05:39<6:19:46,  1.38s/it] 73%|███████▎  | 45410/61904 [1:05:40<6:08:44,  1.34s/it] 73%|███████▎  | 45411/61904 [1:05:41<6:30:57,  1.42s/it] 73%|███████▎  | 45412/61904 [1:05:43<6:32:29,  1.43s/it] 73%|███████▎  | 45413/61904 [1:05:44<6:41:46,  1.46s/it] 73%|███████▎  | 45414/61904 [1:05:46<6:42:25,  1.46s/it] 73%|███████▎  | 45415/61904 [1:05:47<6:36:37,  1.44s/it] 73%|███████▎  | 45416/61904 [1:05:49<6:38:27,  1.45s/it] 73%|███████▎  | 45417/61904 [1:05:50<6:32:49,  1.43s/it] 73%|███████▎  | 45418/61904 [1:05:52<6:26:40,  1.41s/it] 73%|███████▎  | 45419/61904 [1:05:53<6:21:34,  1.39s/it] 73%|███████▎  | 45420/61904 [1:05:54<6:23:29,  1.40s/it]                                                         {'loss': 2.4258, 'learning_rate': 1.267146376247893e-07, 'epoch': 11.74}
 73%|███████▎  | 45420/61904 [1:05:54<6:23:29,  1.40s/it] 73%|███████▎  | 45421/61904 [1:05:56<6:18:09,  1.38s/it] 73%|███████▎  | 45422/61904 [1:05:57<6:18:20,  1.38s/it] 73%|███████▎  | 45423/61904 [1:05:58<6:15:40,  1.37s/it] 73%|███████▎  | 45424/61904 [1:06:00<6:09:55,  1.35s/it] 73%|███████▎  | 45425/61904 [1:06:01<6:15:58,  1.37s/it] 73%|███████▎  | 45426/61904 [1:06:02<6:17:56,  1.38s/it] 73%|███████▎  | 45427/61904 [1:06:04<6:26:12,  1.41s/it] 73%|███████▎  | 45428/61904 [1:06:05<6:12:45,  1.36s/it] 73%|███████▎  | 45429/61904 [1:06:06<6:07:42,  1.34s/it] 73%|███████▎  | 45430/61904 [1:06:08<6:11:02,  1.35s/it] 73%|███████▎  | 45431/61904 [1:06:09<6:06:30,  1.33s/it] 73%|███████▎  | 45432/61904 [1:06:11<6:23:51,  1.40s/it] 73%|███████▎  | 45433/61904 [1:06:12<6:24:52,  1.40s/it] 73%|███████▎  | 45434/61904 [1:06:13<6:25:02,  1.40s/it] 73%|███████▎  | 45435/61904 [1:06:15<6:35:25,  1.44s/it] 73%|███████▎  | 45436/61904 [1:06:16<6:27:58,  1.41s/it] 73%|███████▎  | 45437/61904 [1:06:18<6:16:46,  1.37s/it] 73%|███████▎  | 45438/61904 [1:06:19<6:08:21,  1.34s/it] 73%|███████▎  | 45439/61904 [1:06:20<6:12:44,  1.36s/it] 73%|███████▎  | 45440/61904 [1:06:22<6:09:41,  1.35s/it]                                                         {'loss': 2.4635, 'learning_rate': 1.26682224815247e-07, 'epoch': 11.74}
 73%|███████▎  | 45440/61904 [1:06:22<6:09:41,  1.35s/it] 73%|███████▎  | 45441/61904 [1:06:23<6:16:09,  1.37s/it] 73%|███████▎  | 45442/61904 [1:06:24<6:20:32,  1.39s/it] 73%|███████▎  | 45443/61904 [1:06:26<6:21:36,  1.39s/it] 73%|███████▎  | 45444/61904 [1:06:27<6:07:17,  1.34s/it] 73%|███████▎  | 45445/61904 [1:06:28<6:09:03,  1.35s/it] 73%|███████▎  | 45446/61904 [1:06:30<6:07:38,  1.34s/it] 73%|███████▎  | 45447/61904 [1:06:31<6:09:06,  1.35s/it] 73%|███████▎  | 45448/61904 [1:06:32<6:06:51,  1.34s/it] 73%|███████▎  | 45449/61904 [1:06:34<6:18:11,  1.38s/it] 73%|███████▎  | 45450/61904 [1:06:35<6:08:10,  1.34s/it] 73%|███████▎  | 45451/61904 [1:06:37<6:16:15,  1.37s/it] 73%|███████▎  | 45452/61904 [1:06:38<6:13:14,  1.36s/it] 73%|███████▎  | 45453/61904 [1:06:39<6:12:04,  1.36s/it] 73%|███████▎  | 45454/61904 [1:06:41<6:36:39,  1.45s/it] 73%|███████▎  | 45455/61904 [1:06:42<6:29:31,  1.42s/it] 73%|███████▎  | 45456/61904 [1:06:44<6:22:16,  1.39s/it] 73%|███████▎  | 45457/61904 [1:06:45<6:23:58,  1.40s/it] 73%|███████▎  | 45458/61904 [1:06:47<6:34:37,  1.44s/it] 73%|███████▎  | 45459/61904 [1:06:48<6:33:43,  1.44s/it] 73%|███████▎  | 45460/61904 [1:06:49<6:21:19,  1.39s/it]                                                         {'loss': 2.4803, 'learning_rate': 1.2664981200570465e-07, 'epoch': 11.75}
 73%|███████▎  | 45460/61904 [1:06:49<6:21:19,  1.39s/it] 73%|███████▎  | 45461/61904 [1:06:51<6:08:23,  1.34s/it] 73%|███████▎  | 45462/61904 [1:06:52<6:02:46,  1.32s/it] 73%|███████▎  | 45463/61904 [1:06:53<6:13:12,  1.36s/it] 73%|███████▎  | 45464/61904 [1:06:55<6:17:32,  1.38s/it] 73%|███████▎  | 45465/61904 [1:06:56<6:13:39,  1.36s/it] 73%|███████▎  | 45466/61904 [1:06:57<6:05:42,  1.33s/it] 73%|███████▎  | 45467/61904 [1:06:59<6:26:52,  1.41s/it] 73%|███████▎  | 45468/61904 [1:07:00<6:25:49,  1.41s/it] 73%|███████▎  | 45469/61904 [1:07:02<6:20:54,  1.39s/it] 73%|███████▎  | 45470/61904 [1:07:03<6:37:00,  1.45s/it] 73%|███████▎  | 45471/61904 [1:07:05<6:29:12,  1.42s/it] 73%|███████▎  | 45472/61904 [1:07:06<6:14:46,  1.37s/it] 73%|███████▎  | 45473/61904 [1:07:07<6:08:34,  1.35s/it] 73%|███████▎  | 45474/61904 [1:07:08<6:05:35,  1.34s/it] 73%|███████▎  | 45475/61904 [1:07:10<6:13:49,  1.37s/it] 73%|███████▎  | 45476/61904 [1:07:11<6:23:59,  1.40s/it] 73%|███████▎  | 45477/61904 [1:07:13<6:11:51,  1.36s/it] 73%|███████▎  | 45478/61904 [1:07:14<6:10:23,  1.35s/it] 73%|███████▎  | 45479/61904 [1:07:15<6:11:50,  1.36s/it] 73%|███████▎  | 45480/61904 [1:07:17<6:13:03,  1.36s/it]                                                         {'loss': 2.4333, 'learning_rate': 1.2661739919616232e-07, 'epoch': 11.75}
 73%|███████▎  | 45480/61904 [1:07:17<6:13:03,  1.36s/it] 73%|███████▎  | 45481/61904 [1:07:18<6:23:09,  1.40s/it] 73%|███████▎  | 45482/61904 [1:07:20<6:26:12,  1.41s/it] 73%|███████▎  | 45483/61904 [1:07:21<6:13:03,  1.36s/it] 73%|███████▎  | 45484/61904 [1:07:22<6:09:37,  1.35s/it] 73%|███████▎  | 45485/61904 [1:07:24<6:15:26,  1.37s/it] 73%|███████▎  | 45486/61904 [1:07:25<6:10:33,  1.35s/it] 73%|███████▎  | 45487/61904 [1:07:26<6:24:38,  1.41s/it] 73%|███████▎  | 45488/61904 [1:07:28<6:15:44,  1.37s/it] 73%|███████▎  | 45489/61904 [1:07:29<6:13:31,  1.37s/it] 73%|███████▎  | 45490/61904 [1:07:30<6:11:37,  1.36s/it] 73%|███████▎  | 45491/61904 [1:07:32<6:18:38,  1.38s/it] 73%|███████▎  | 45492/61904 [1:07:33<6:10:41,  1.36s/it] 73%|███████▎  | 45493/61904 [1:07:35<6:11:31,  1.36s/it] 73%|███████▎  | 45494/61904 [1:07:36<6:23:20,  1.40s/it] 73%|███████▎  | 45495/61904 [1:07:37<6:14:20,  1.37s/it] 73%|███████▎  | 45496/61904 [1:07:39<6:07:37,  1.34s/it] 73%|███████▎  | 45497/61904 [1:07:40<6:15:34,  1.37s/it] 73%|███████▎  | 45498/61904 [1:07:41<6:11:36,  1.36s/it] 73%|███████▎  | 45499/61904 [1:07:43<6:10:00,  1.35s/it] 74%|███████▎  | 45500/61904 [1:07:44<6:10:35,  1.36s/it]                                                         {'loss': 2.5486, 'learning_rate': 1.2658498638661998e-07, 'epoch': 11.76}
 74%|███████▎  | 45500/61904 [1:07:44<6:10:35,  1.36s/it] 74%|███████▎  | 45501/61904 [1:07:45<6:14:10,  1.37s/it] 74%|███████▎  | 45502/61904 [1:07:47<6:11:25,  1.36s/it] 74%|███████▎  | 45503/61904 [1:07:48<6:12:14,  1.36s/it] 74%|███████▎  | 45504/61904 [1:07:50<6:06:53,  1.34s/it] 74%|███████▎  | 45505/61904 [1:07:51<6:08:45,  1.35s/it] 74%|███████▎  | 45506/61904 [1:07:52<6:03:36,  1.33s/it] 74%|███████▎  | 45507/61904 [1:07:54<6:16:54,  1.38s/it] 74%|███████▎  | 45508/61904 [1:07:55<6:11:23,  1.36s/it] 74%|███████▎  | 45509/61904 [1:07:56<6:00:17,  1.32s/it] 74%|███████▎  | 45510/61904 [1:07:58<6:07:58,  1.35s/it] 74%|███████▎  | 45511/61904 [1:07:59<6:33:20,  1.44s/it] 74%|███████▎  | 45512/61904 [1:08:01<6:33:09,  1.44s/it] 74%|███████▎  | 45513/61904 [1:08:02<6:39:50,  1.46s/it] 74%|███████▎  | 45514/61904 [1:08:04<6:29:11,  1.42s/it] 74%|███████▎  | 45515/61904 [1:08:05<6:17:08,  1.38s/it] 74%|███████▎  | 45516/61904 [1:08:06<6:12:00,  1.36s/it] 74%|███████▎  | 45517/61904 [1:08:08<6:18:57,  1.39s/it] 74%|███████▎  | 45518/61904 [1:08:09<6:12:35,  1.36s/it] 74%|███████▎  | 45519/61904 [1:08:10<6:27:04,  1.42s/it] 74%|███████▎  | 45520/61904 [1:08:12<6:30:28,  1.43s/it]                                                         {'loss': 2.4803, 'learning_rate': 1.2655257357707767e-07, 'epoch': 11.77}
 74%|███████▎  | 45520/61904 [1:08:12<6:30:28,  1.43s/it] 74%|███████▎  | 45521/61904 [1:08:13<6:16:20,  1.38s/it] 74%|███████▎  | 45522/61904 [1:08:14<6:03:22,  1.33s/it] 74%|███████▎  | 45523/61904 [1:08:16<6:11:13,  1.36s/it] 74%|███████▎  | 45524/61904 [1:08:17<6:17:38,  1.38s/it] 74%|███████▎  | 45525/61904 [1:08:19<6:19:01,  1.39s/it] 74%|███████▎  | 45526/61904 [1:08:20<6:06:41,  1.34s/it] 74%|███████▎  | 45527/61904 [1:08:21<6:10:22,  1.36s/it] 74%|███████▎  | 45528/61904 [1:08:23<6:19:34,  1.39s/it] 74%|███████▎  | 45529/61904 [1:08:24<6:16:37,  1.38s/it] 74%|███████▎  | 45530/61904 [1:08:25<6:13:42,  1.37s/it] 74%|███████▎  | 45531/61904 [1:08:27<6:03:40,  1.33s/it] 74%|███████▎  | 45532/61904 [1:08:28<5:57:57,  1.31s/it] 74%|███████▎  | 45533/61904 [1:08:29<5:51:40,  1.29s/it] 74%|███████▎  | 45534/61904 [1:08:31<6:05:14,  1.34s/it] 74%|███████▎  | 45535/61904 [1:08:32<6:13:45,  1.37s/it] 74%|███████▎  | 45536/61904 [1:08:33<6:04:44,  1.34s/it] 74%|███████▎  | 45537/61904 [1:08:35<6:08:21,  1.35s/it] 74%|███████▎  | 45538/61904 [1:08:36<5:57:31,  1.31s/it] 74%|███████▎  | 45539/61904 [1:08:37<6:01:09,  1.32s/it] 74%|███████▎  | 45540/61904 [1:08:39<6:06:59,  1.35s/it]                                                         {'loss': 2.4958, 'learning_rate': 1.2652016076753533e-07, 'epoch': 11.77}
 74%|███████▎  | 45540/61904 [1:08:39<6:06:59,  1.35s/it] 74%|███████▎  | 45541/61904 [1:08:40<6:03:09,  1.33s/it] 74%|███████▎  | 45542/61904 [1:08:42<6:22:19,  1.40s/it] 74%|███████▎  | 45543/61904 [1:08:43<6:27:52,  1.42s/it] 74%|███████▎  | 45544/61904 [1:08:44<6:13:48,  1.37s/it] 74%|███████▎  | 45545/61904 [1:08:46<6:18:16,  1.39s/it] 74%|███████▎  | 45546/61904 [1:08:47<6:16:24,  1.38s/it] 74%|███████▎  | 45547/61904 [1:08:48<6:08:56,  1.35s/it] 74%|███████▎  | 45548/61904 [1:08:50<6:00:33,  1.32s/it] 74%|███████▎  | 45549/61904 [1:08:51<6:16:30,  1.38s/it] 74%|███████▎  | 45550/61904 [1:08:53<6:16:10,  1.38s/it] 74%|███████▎  | 45551/61904 [1:08:54<6:21:04,  1.40s/it] 74%|███████▎  | 45552/61904 [1:08:55<6:13:16,  1.37s/it] 74%|███████▎  | 45553/61904 [1:08:57<6:16:02,  1.38s/it] 74%|███████▎  | 45554/61904 [1:08:58<6:15:53,  1.38s/it] 74%|███████▎  | 45555/61904 [1:08:59<6:10:48,  1.36s/it] 74%|███████▎  | 45556/61904 [1:09:01<6:19:54,  1.39s/it] 74%|███████▎  | 45557/61904 [1:09:02<6:05:08,  1.34s/it] 74%|███████▎  | 45558/61904 [1:09:03<6:00:25,  1.32s/it] 74%|███████▎  | 45559/61904 [1:09:05<6:14:47,  1.38s/it] 74%|███████▎  | 45560/61904 [1:09:06<6:09:41,  1.36s/it]                                                         {'loss': 2.4918, 'learning_rate': 1.26487747957993e-07, 'epoch': 11.78}
 74%|███████▎  | 45560/61904 [1:09:06<6:09:41,  1.36s/it] 74%|███████▎  | 45561/61904 [1:09:08<6:15:56,  1.38s/it] 74%|███████▎  | 45562/61904 [1:09:09<6:16:51,  1.38s/it] 74%|███████▎  | 45563/61904 [1:09:10<6:26:00,  1.42s/it] 74%|███████▎  | 45564/61904 [1:09:12<6:20:48,  1.40s/it] 74%|███████▎  | 45565/61904 [1:09:13<6:16:24,  1.38s/it] 74%|███████▎  | 45566/61904 [1:09:15<6:27:42,  1.42s/it] 74%|███████▎  | 45567/61904 [1:09:16<6:24:01,  1.41s/it] 74%|███████▎  | 45568/61904 [1:09:17<6:09:58,  1.36s/it] 74%|███████▎  | 45569/61904 [1:09:19<6:23:52,  1.41s/it] 74%|███████▎  | 45570/61904 [1:09:20<6:30:12,  1.43s/it] 74%|███████▎  | 45571/61904 [1:09:22<6:23:30,  1.41s/it] 74%|███████▎  | 45572/61904 [1:09:23<6:39:37,  1.47s/it] 74%|███████▎  | 45573/61904 [1:09:25<6:22:08,  1.40s/it] 74%|███████▎  | 45574/61904 [1:09:26<6:22:45,  1.41s/it] 74%|███████▎  | 45575/61904 [1:09:27<6:14:52,  1.38s/it] 74%|███████▎  | 45576/61904 [1:09:29<6:15:31,  1.38s/it] 74%|███████▎  | 45577/61904 [1:09:30<6:23:31,  1.41s/it] 74%|███████▎  | 45578/61904 [1:09:32<6:26:18,  1.42s/it] 74%|███████▎  | 45579/61904 [1:09:33<6:23:52,  1.41s/it] 74%|███████▎  | 45580/61904 [1:09:34<6:23:41,  1.41s/it]                                                         {'loss': 2.513, 'learning_rate': 1.2645533514845065e-07, 'epoch': 11.78}
 74%|███████▎  | 45580/61904 [1:09:34<6:23:41,  1.41s/it] 74%|███████▎  | 45581/61904 [1:09:36<6:31:11,  1.44s/it] 74%|███████▎  | 45582/61904 [1:09:37<6:25:41,  1.42s/it] 74%|███████▎  | 45583/61904 [1:09:39<6:19:50,  1.40s/it] 74%|███████▎  | 45584/61904 [1:09:40<6:29:49,  1.43s/it] 74%|███████▎  | 45585/61904 [1:09:41<6:18:58,  1.39s/it] 74%|███████▎  | 45586/61904 [1:09:43<6:22:53,  1.41s/it] 74%|███████▎  | 45587/61904 [1:09:44<6:10:13,  1.36s/it] 74%|███████▎  | 45588/61904 [1:09:45<6:14:47,  1.38s/it] 74%|███████▎  | 45589/61904 [1:09:47<6:11:16,  1.37s/it] 74%|███████▎  | 45590/61904 [1:09:48<6:10:24,  1.36s/it] 74%|███████▎  | 45591/61904 [1:09:49<6:03:36,  1.34s/it] 74%|███████▎  | 45592/61904 [1:09:51<6:04:51,  1.34s/it] 74%|███████▎  | 45593/61904 [1:09:52<5:58:22,  1.32s/it] 74%|███████▎  | 45594/61904 [1:09:53<6:00:37,  1.33s/it] 74%|███████▎  | 45595/61904 [1:09:55<5:53:45,  1.30s/it] 74%|███████▎  | 45596/61904 [1:09:56<5:55:53,  1.31s/it] 74%|███████▎  | 45597/61904 [1:09:57<5:56:52,  1.31s/it] 74%|███████▎  | 45598/61904 [1:09:59<5:52:29,  1.30s/it] 74%|███████▎  | 45599/61904 [1:10:00<5:54:18,  1.30s/it] 74%|███████▎  | 45600/61904 [1:10:01<5:53:41,  1.30s/it]                                                         {'loss': 2.4897, 'learning_rate': 1.2642292233890834e-07, 'epoch': 11.79}
 74%|███████▎  | 45600/61904 [1:10:01<5:53:41,  1.30s/it] 74%|███████▎  | 45601/61904 [1:10:02<5:50:21,  1.29s/it] 74%|███████▎  | 45602/61904 [1:10:04<5:54:31,  1.30s/it] 74%|███████▎  | 45603/61904 [1:10:05<6:07:37,  1.35s/it] 74%|███████▎  | 45604/61904 [1:10:07<6:01:51,  1.33s/it] 74%|███████▎  | 45605/61904 [1:10:08<6:03:11,  1.34s/it] 74%|███████▎  | 45606/61904 [1:10:09<6:06:14,  1.35s/it] 74%|███████▎  | 45607/61904 [1:10:11<6:01:45,  1.33s/it] 74%|███████▎  | 45608/61904 [1:10:12<6:07:10,  1.35s/it] 74%|███████▎  | 45609/61904 [1:10:13<6:00:18,  1.33s/it] 74%|███████▎  | 45610/61904 [1:10:15<6:25:48,  1.42s/it] 74%|███████▎  | 45611/61904 [1:10:16<6:22:43,  1.41s/it] 74%|███████▎  | 45612/61904 [1:10:18<6:10:04,  1.36s/it] 74%|███████▎  | 45613/61904 [1:10:19<6:08:53,  1.36s/it] 74%|███████▎  | 45614/61904 [1:10:20<6:08:02,  1.36s/it] 74%|███████▎  | 45615/61904 [1:10:22<6:08:34,  1.36s/it] 74%|███████▎  | 45616/61904 [1:10:23<6:09:36,  1.36s/it] 74%|███████▎  | 45617/61904 [1:10:24<6:16:21,  1.39s/it] 74%|███████▎  | 45618/61904 [1:10:26<6:10:49,  1.37s/it] 74%|███████▎  | 45619/61904 [1:10:27<6:05:41,  1.35s/it] 74%|███████▎  | 45620/61904 [1:10:29<6:17:42,  1.39s/it]                                                         {'loss': 2.4468, 'learning_rate': 1.26390509529366e-07, 'epoch': 11.79}
 74%|███████▎  | 45620/61904 [1:10:29<6:17:42,  1.39s/it] 74%|███████▎  | 45621/61904 [1:10:30<6:21:59,  1.41s/it] 74%|███████▎  | 45622/61904 [1:10:31<6:22:49,  1.41s/it] 74%|███████▎  | 45623/61904 [1:10:33<6:12:40,  1.37s/it] 74%|███████▎  | 45624/61904 [1:10:34<6:15:58,  1.39s/it] 74%|███████▎  | 45625/61904 [1:10:35<6:11:07,  1.37s/it] 74%|███████▎  | 45626/61904 [1:10:37<6:15:56,  1.39s/it] 74%|███████▎  | 45627/61904 [1:10:38<6:10:28,  1.37s/it] 74%|███████▎  | 45628/61904 [1:10:40<6:22:27,  1.41s/it] 74%|███████▎  | 45629/61904 [1:10:41<6:38:04,  1.47s/it] 74%|███████▎  | 45630/61904 [1:10:43<6:36:13,  1.46s/it] 74%|███████▎  | 45631/61904 [1:10:44<6:37:10,  1.46s/it] 74%|███████▎  | 45632/61904 [1:10:46<6:29:21,  1.44s/it] 74%|███████▎  | 45633/61904 [1:10:47<6:23:36,  1.41s/it] 74%|███████▎  | 45634/61904 [1:10:48<6:13:54,  1.38s/it] 74%|███████▎  | 45635/61904 [1:10:50<6:07:47,  1.36s/it] 74%|███████▎  | 45636/61904 [1:10:51<6:15:55,  1.39s/it] 74%|███████▎  | 45637/61904 [1:10:52<6:10:32,  1.37s/it] 74%|███████▎  | 45638/61904 [1:10:54<6:13:00,  1.38s/it] 74%|███████▎  | 45639/61904 [1:10:55<6:06:42,  1.35s/it] 74%|███████▎  | 45640/61904 [1:10:56<6:06:45,  1.35s/it]                                                         {'loss': 2.4928, 'learning_rate': 1.2635809671982366e-07, 'epoch': 11.8}
 74%|███████▎  | 45640/61904 [1:10:56<6:06:45,  1.35s/it] 74%|███████▎  | 45641/61904 [1:10:58<6:16:29,  1.39s/it] 74%|███████▎  | 45642/61904 [1:10:59<6:10:20,  1.37s/it] 74%|███████▎  | 45643/61904 [1:11:00<6:06:20,  1.35s/it] 74%|███████▎  | 45644/61904 [1:11:02<6:24:26,  1.42s/it] 74%|███████▎  | 45645/61904 [1:11:03<6:19:05,  1.40s/it] 74%|███████▎  | 45646/61904 [1:11:05<6:09:33,  1.36s/it] 74%|███████▎  | 45647/61904 [1:11:06<5:58:26,  1.32s/it] 74%|███████▎  | 45648/61904 [1:11:07<6:03:30,  1.34s/it] 74%|███████▎  | 45649/61904 [1:11:09<6:01:15,  1.33s/it] 74%|███████▎  | 45650/61904 [1:11:10<6:06:50,  1.35s/it] 74%|███████▎  | 45651/61904 [1:11:11<6:14:05,  1.38s/it] 74%|███████▎  | 45652/61904 [1:11:13<6:04:50,  1.35s/it] 74%|███████▎  | 45653/61904 [1:11:14<6:08:19,  1.36s/it] 74%|███████▎  | 45654/61904 [1:11:15<6:08:59,  1.36s/it] 74%|███████▍  | 45655/61904 [1:11:17<6:06:19,  1.35s/it] 74%|███████▍  | 45656/61904 [1:11:18<6:09:30,  1.36s/it] 74%|███████▍  | 45657/61904 [1:11:20<6:09:36,  1.36s/it] 74%|███████▍  | 45658/61904 [1:11:21<6:00:33,  1.33s/it] 74%|███████▍  | 45659/61904 [1:11:22<6:08:32,  1.36s/it] 74%|███████▍  | 45660/61904 [1:11:24<6:05:05,  1.35s/it]                                                         {'loss': 2.4793, 'learning_rate': 1.2632568391028132e-07, 'epoch': 11.8}
 74%|███████▍  | 45660/61904 [1:11:24<6:05:05,  1.35s/it] 74%|███████▍  | 45661/61904 [1:11:25<6:07:45,  1.36s/it] 74%|███████▍  | 45662/61904 [1:11:26<6:09:33,  1.37s/it] 74%|███████▍  | 45663/61904 [1:11:28<6:10:50,  1.37s/it] 74%|███████▍  | 45664/61904 [1:11:29<6:20:38,  1.41s/it] 74%|███████▍  | 45665/61904 [1:11:30<6:11:03,  1.37s/it] 74%|███████▍  | 45666/61904 [1:11:32<6:10:54,  1.37s/it] 74%|███████▍  | 45667/61904 [1:11:33<6:18:40,  1.40s/it] 74%|███████▍  | 45668/61904 [1:11:35<6:14:11,  1.38s/it] 74%|███████▍  | 45669/61904 [1:11:36<6:13:28,  1.38s/it] 74%|███████▍  | 45670/61904 [1:11:37<6:04:54,  1.35s/it] 74%|███████▍  | 45671/61904 [1:11:39<6:05:49,  1.35s/it] 74%|███████▍  | 45672/61904 [1:11:40<6:35:50,  1.46s/it] 74%|███████▍  | 45673/61904 [1:11:42<6:44:28,  1.50s/it] 74%|███████▍  | 45674/61904 [1:11:43<6:29:42,  1.44s/it] 74%|███████▍  | 45675/61904 [1:11:45<6:27:45,  1.43s/it] 74%|███████▍  | 45676/61904 [1:11:46<6:22:08,  1.41s/it] 74%|███████▍  | 45677/61904 [1:11:47<6:24:21,  1.42s/it] 74%|███████▍  | 45678/61904 [1:11:49<6:27:15,  1.43s/it] 74%|███████▍  | 45679/61904 [1:11:50<6:21:29,  1.41s/it] 74%|███████▍  | 45680/61904 [1:11:52<6:07:59,  1.36s/it]                                                         {'loss': 2.4788, 'learning_rate': 1.26293271100739e-07, 'epoch': 11.81}
 74%|███████▍  | 45680/61904 [1:11:52<6:07:59,  1.36s/it] 74%|███████▍  | 45681/61904 [1:11:53<6:07:23,  1.36s/it] 74%|███████▍  | 45682/61904 [1:11:54<6:03:57,  1.35s/it] 74%|███████▍  | 45683/61904 [1:11:56<6:19:55,  1.41s/it] 74%|███████▍  | 45684/61904 [1:11:57<6:06:47,  1.36s/it] 74%|███████▍  | 45685/61904 [1:11:58<6:05:33,  1.35s/it] 74%|███████▍  | 45686/61904 [1:12:00<5:56:47,  1.32s/it] 74%|███████▍  | 45687/61904 [1:12:01<5:57:46,  1.32s/it] 74%|███████▍  | 45688/61904 [1:12:02<5:50:53,  1.30s/it] 74%|███████▍  | 45689/61904 [1:12:04<5:59:17,  1.33s/it] 74%|███████▍  | 45690/61904 [1:12:05<6:00:34,  1.33s/it] 74%|███████▍  | 45691/61904 [1:12:06<6:10:45,  1.37s/it] 74%|███████▍  | 45692/61904 [1:12:08<6:12:12,  1.38s/it] 74%|███████▍  | 45693/61904 [1:12:09<6:04:11,  1.35s/it] 74%|███████▍  | 45694/61904 [1:12:10<6:08:11,  1.36s/it] 74%|███████▍  | 45695/61904 [1:12:12<6:03:36,  1.35s/it] 74%|███████▍  | 45696/61904 [1:12:13<6:06:37,  1.36s/it] 74%|███████▍  | 45697/61904 [1:12:14<6:05:51,  1.35s/it] 74%|███████▍  | 45698/61904 [1:12:16<6:16:06,  1.39s/it] 74%|███████▍  | 45699/61904 [1:12:18<6:52:01,  1.53s/it] 74%|███████▍  | 45700/61904 [1:12:19<6:37:33,  1.47s/it]                                                         {'loss': 2.4913, 'learning_rate': 1.2626085829119668e-07, 'epoch': 11.81}
 74%|███████▍  | 45700/61904 [1:12:19<6:37:33,  1.47s/it] 74%|███████▍  | 45701/61904 [1:12:20<6:29:10,  1.44s/it] 74%|███████▍  | 45702/61904 [1:12:22<6:32:18,  1.45s/it] 74%|███████▍  | 45703/61904 [1:12:23<6:27:38,  1.44s/it] 74%|███████▍  | 45704/61904 [1:12:25<6:28:25,  1.44s/it] 74%|███████▍  | 45705/61904 [1:12:26<6:21:37,  1.41s/it] 74%|███████▍  | 45706/61904 [1:12:28<6:20:41,  1.41s/it] 74%|███████▍  | 45707/61904 [1:12:29<6:16:35,  1.40s/it] 74%|███████▍  | 45708/61904 [1:12:30<6:14:09,  1.39s/it] 74%|███████▍  | 45709/61904 [1:12:32<6:45:02,  1.50s/it] 74%|███████▍  | 45710/61904 [1:12:33<6:29:49,  1.44s/it] 74%|███████▍  | 45711/61904 [1:12:35<6:20:32,  1.41s/it] 74%|███████▍  | 45712/61904 [1:12:36<6:17:21,  1.40s/it] 74%|███████▍  | 45713/61904 [1:12:37<6:13:44,  1.39s/it] 74%|███████▍  | 45714/61904 [1:12:39<6:09:27,  1.37s/it] 74%|███████▍  | 45715/61904 [1:12:40<6:07:24,  1.36s/it] 74%|███████▍  | 45716/61904 [1:12:41<5:54:39,  1.31s/it] 74%|███████▍  | 45717/61904 [1:12:43<6:02:51,  1.35s/it] 74%|███████▍  | 45718/61904 [1:12:44<6:06:09,  1.36s/it] 74%|███████▍  | 45719/61904 [1:12:45<6:04:24,  1.35s/it] 74%|███████▍  | 45720/61904 [1:12:47<6:13:30,  1.38s/it]                                                         {'loss': 2.4966, 'learning_rate': 1.2622844548165434e-07, 'epoch': 11.82}
 74%|███████▍  | 45720/61904 [1:12:47<6:13:30,  1.38s/it] 74%|███████▍  | 45721/61904 [1:12:48<6:06:57,  1.36s/it] 74%|███████▍  | 45722/61904 [1:12:50<5:59:58,  1.33s/it] 74%|███████▍  | 45723/61904 [1:12:51<5:53:31,  1.31s/it] 74%|███████▍  | 45724/61904 [1:12:52<5:53:11,  1.31s/it] 74%|███████▍  | 45725/61904 [1:12:53<5:45:31,  1.28s/it] 74%|███████▍  | 45726/61904 [1:12:55<5:50:44,  1.30s/it] 74%|███████▍  | 45727/61904 [1:12:56<5:51:27,  1.30s/it] 74%|███████▍  | 45728/61904 [1:12:57<5:58:55,  1.33s/it] 74%|███████▍  | 45729/61904 [1:12:59<6:14:36,  1.39s/it] 74%|███████▍  | 45730/61904 [1:13:00<6:10:56,  1.38s/it] 74%|███████▍  | 45731/61904 [1:13:02<6:06:45,  1.36s/it] 74%|███████▍  | 45732/61904 [1:13:03<5:59:04,  1.33s/it] 74%|███████▍  | 45733/61904 [1:13:04<5:53:24,  1.31s/it] 74%|███████▍  | 45734/61904 [1:13:06<6:06:19,  1.36s/it] 74%|███████▍  | 45735/61904 [1:13:07<6:13:02,  1.38s/it] 74%|███████▍  | 45736/61904 [1:13:08<6:06:56,  1.36s/it] 74%|███████▍  | 45737/61904 [1:13:10<5:58:13,  1.33s/it] 74%|███████▍  | 45738/61904 [1:13:11<5:52:54,  1.31s/it] 74%|███████▍  | 45739/61904 [1:13:12<6:00:58,  1.34s/it] 74%|███████▍  | 45740/61904 [1:13:14<6:27:26,  1.44s/it]                                                         {'loss': 2.4954, 'learning_rate': 1.2619603267211203e-07, 'epoch': 11.82}
 74%|███████▍  | 45740/61904 [1:13:14<6:27:26,  1.44s/it] 74%|███████▍  | 45741/61904 [1:13:15<6:22:55,  1.42s/it] 74%|███████▍  | 45742/61904 [1:13:17<6:09:05,  1.37s/it] 74%|███████▍  | 45743/61904 [1:13:18<6:01:39,  1.34s/it] 74%|███████▍  | 45744/61904 [1:13:19<5:59:52,  1.34s/it] 74%|███████▍  | 45745/61904 [1:13:21<6:15:44,  1.40s/it] 74%|███████▍  | 45746/61904 [1:13:22<6:07:24,  1.36s/it] 74%|███████▍  | 45747/61904 [1:13:23<6:06:59,  1.36s/it] 74%|███████▍  | 45748/61904 [1:13:25<6:04:53,  1.36s/it] 74%|███████▍  | 45749/61904 [1:13:26<5:59:24,  1.33s/it] 74%|███████▍  | 45750/61904 [1:13:27<6:02:50,  1.35s/it] 74%|███████▍  | 45751/61904 [1:13:29<6:08:37,  1.37s/it] 74%|███████▍  | 45752/61904 [1:13:30<5:55:51,  1.32s/it] 74%|███████▍  | 45753/61904 [1:13:31<5:59:07,  1.33s/it] 74%|███████▍  | 45754/61904 [1:13:33<6:03:40,  1.35s/it] 74%|███████▍  | 45755/61904 [1:13:34<6:03:59,  1.35s/it] 74%|███████▍  | 45756/61904 [1:13:35<6:12:09,  1.38s/it] 74%|███████▍  | 45757/61904 [1:13:37<6:24:36,  1.43s/it] 74%|███████▍  | 45758/61904 [1:13:38<6:21:05,  1.42s/it] 74%|███████▍  | 45759/61904 [1:13:40<6:17:37,  1.40s/it] 74%|███████▍  | 45760/61904 [1:13:41<6:20:10,  1.41s/it]                                                         {'loss': 2.4608, 'learning_rate': 1.261636198625697e-07, 'epoch': 11.83}
 74%|███████▍  | 45760/61904 [1:13:41<6:20:10,  1.41s/it] 74%|███████▍  | 45761/61904 [1:13:43<6:10:44,  1.38s/it] 74%|███████▍  | 45762/61904 [1:13:44<6:09:05,  1.37s/it] 74%|███████▍  | 45763/61904 [1:13:45<6:12:40,  1.39s/it] 74%|███████▍  | 45764/61904 [1:13:47<6:13:02,  1.39s/it] 74%|███████▍  | 45765/61904 [1:13:48<6:23:14,  1.42s/it] 74%|███████▍  | 45766/61904 [1:13:49<6:11:04,  1.38s/it] 74%|███████▍  | 45767/61904 [1:13:51<6:12:49,  1.39s/it] 74%|███████▍  | 45768/61904 [1:13:52<6:08:24,  1.37s/it] 74%|███████▍  | 45769/61904 [1:13:54<6:14:47,  1.39s/it] 74%|███████▍  | 45770/61904 [1:13:55<6:07:01,  1.36s/it] 74%|███████▍  | 45771/61904 [1:13:56<6:10:47,  1.38s/it] 74%|███████▍  | 45772/61904 [1:13:58<5:56:42,  1.33s/it] 74%|███████▍  | 45773/61904 [1:13:59<5:58:23,  1.33s/it] 74%|███████▍  | 45774/61904 [1:14:00<5:55:12,  1.32s/it] 74%|███████▍  | 45775/61904 [1:14:02<6:05:43,  1.36s/it] 74%|███████▍  | 45776/61904 [1:14:03<6:13:06,  1.39s/it] 74%|███████▍  | 45777/61904 [1:14:04<6:10:42,  1.38s/it] 74%|███████▍  | 45778/61904 [1:14:06<6:10:07,  1.38s/it] 74%|███████▍  | 45779/61904 [1:14:07<6:15:27,  1.40s/it] 74%|███████▍  | 45780/61904 [1:14:09<6:15:17,  1.40s/it]                                                         {'loss': 2.4901, 'learning_rate': 1.2613120705302735e-07, 'epoch': 11.83}
 74%|███████▍  | 45780/61904 [1:14:09<6:15:17,  1.40s/it] 74%|███████▍  | 45781/61904 [1:14:10<6:15:31,  1.40s/it] 74%|███████▍  | 45782/61904 [1:14:11<6:05:11,  1.36s/it] 74%|███████▍  | 45783/61904 [1:14:13<5:58:37,  1.33s/it] 74%|███████▍  | 45784/61904 [1:14:14<5:57:12,  1.33s/it] 74%|███████▍  | 45785/61904 [1:14:15<5:51:45,  1.31s/it] 74%|███████▍  | 45786/61904 [1:14:17<5:59:56,  1.34s/it] 74%|███████▍  | 45787/61904 [1:14:18<6:01:25,  1.35s/it] 74%|███████▍  | 45788/61904 [1:14:19<5:57:33,  1.33s/it] 74%|███████▍  | 45789/61904 [1:14:21<6:02:15,  1.35s/it] 74%|███████▍  | 45790/61904 [1:14:22<6:03:05,  1.35s/it] 74%|███████▍  | 45791/61904 [1:14:23<6:08:24,  1.37s/it] 74%|███████▍  | 45792/61904 [1:14:25<6:04:59,  1.36s/it] 74%|███████▍  | 45793/61904 [1:14:26<6:20:48,  1.42s/it] 74%|███████▍  | 45794/61904 [1:14:28<6:28:18,  1.45s/it] 74%|███████▍  | 45795/61904 [1:14:29<6:40:11,  1.49s/it] 74%|███████▍  | 45796/61904 [1:14:31<6:32:02,  1.46s/it] 74%|███████▍  | 45797/61904 [1:14:32<6:37:44,  1.48s/it] 74%|███████▍  | 45798/61904 [1:14:34<6:31:31,  1.46s/it] 74%|███████▍  | 45799/61904 [1:14:35<6:16:26,  1.40s/it] 74%|███████▍  | 45800/61904 [1:14:36<6:07:05,  1.37s/it]                                                         {'loss': 2.5462, 'learning_rate': 1.26098794243485e-07, 'epoch': 11.84}
 74%|███████▍  | 45800/61904 [1:14:36<6:07:05,  1.37s/it] 74%|███████▍  | 45801/61904 [1:14:38<5:58:02,  1.33s/it] 74%|███████▍  | 45802/61904 [1:14:39<6:01:39,  1.35s/it] 74%|███████▍  | 45803/61904 [1:14:40<5:54:19,  1.32s/it] 74%|███████▍  | 45804/61904 [1:14:42<6:07:14,  1.37s/it] 74%|███████▍  | 45805/61904 [1:14:43<6:06:13,  1.36s/it] 74%|███████▍  | 45806/61904 [1:14:44<6:03:49,  1.36s/it] 74%|███████▍  | 45807/61904 [1:14:46<6:02:40,  1.35s/it] 74%|███████▍  | 45808/61904 [1:14:47<5:58:23,  1.34s/it] 74%|███████▍  | 45809/61904 [1:14:48<5:44:29,  1.28s/it] 74%|███████▍  | 45810/61904 [1:14:50<5:58:57,  1.34s/it] 74%|███████▍  | 45811/61904 [1:14:51<6:00:11,  1.34s/it] 74%|███████▍  | 45812/61904 [1:14:52<5:56:48,  1.33s/it] 74%|███████▍  | 45813/61904 [1:14:54<6:05:56,  1.36s/it] 74%|███████▍  | 45814/61904 [1:14:55<6:13:46,  1.39s/it] 74%|███████▍  | 45815/61904 [1:14:57<6:11:44,  1.39s/it] 74%|███████▍  | 45816/61904 [1:14:58<6:21:44,  1.42s/it] 74%|███████▍  | 45817/61904 [1:14:59<6:02:01,  1.35s/it] 74%|███████▍  | 45818/61904 [1:15:01<5:53:57,  1.32s/it] 74%|███████▍  | 45819/61904 [1:15:02<5:48:57,  1.30s/it] 74%|███████▍  | 45820/61904 [1:15:03<6:02:30,  1.35s/it]                                                         {'loss': 2.5217, 'learning_rate': 1.260663814339427e-07, 'epoch': 11.84}
 74%|███████▍  | 45820/61904 [1:15:03<6:02:30,  1.35s/it] 74%|███████▍  | 45821/61904 [1:15:05<6:07:09,  1.37s/it] 74%|███████▍  | 45822/61904 [1:15:06<5:59:42,  1.34s/it] 74%|███████▍  | 45823/61904 [1:15:07<5:50:48,  1.31s/it] 74%|███████▍  | 45824/61904 [1:15:09<6:03:21,  1.36s/it] 74%|███████▍  | 45825/61904 [1:15:10<5:56:33,  1.33s/it] 74%|███████▍  | 45826/61904 [1:15:11<5:57:01,  1.33s/it] 74%|███████▍  | 45827/61904 [1:15:13<5:58:26,  1.34s/it] 74%|███████▍  | 45828/61904 [1:15:14<6:20:20,  1.42s/it] 74%|███████▍  | 45829/61904 [1:15:15<6:00:54,  1.35s/it] 74%|███████▍  | 45830/61904 [1:15:17<6:04:08,  1.36s/it] 74%|███████▍  | 45831/61904 [1:15:18<6:08:04,  1.37s/it] 74%|███████▍  | 45832/61904 [1:15:19<6:03:44,  1.36s/it] 74%|███████▍  | 45833/61904 [1:15:21<6:00:47,  1.35s/it] 74%|███████▍  | 45834/61904 [1:15:22<6:05:34,  1.36s/it] 74%|███████▍  | 45835/61904 [1:15:24<5:58:32,  1.34s/it] 74%|███████▍  | 45836/61904 [1:15:25<6:14:35,  1.40s/it] 74%|███████▍  | 45837/61904 [1:15:26<6:08:46,  1.38s/it] 74%|███████▍  | 45838/61904 [1:15:28<6:00:30,  1.35s/it] 74%|███████▍  | 45839/61904 [1:15:29<6:10:37,  1.38s/it] 74%|███████▍  | 45840/61904 [1:15:31<6:13:53,  1.40s/it]                                                         {'loss': 2.4889, 'learning_rate': 1.2603396862440036e-07, 'epoch': 11.85}
 74%|███████▍  | 45840/61904 [1:15:31<6:13:53,  1.40s/it] 74%|███████▍  | 45841/61904 [1:15:32<6:09:11,  1.38s/it] 74%|███████▍  | 45842/61904 [1:15:33<6:07:56,  1.37s/it] 74%|███████▍  | 45843/61904 [1:15:35<6:07:23,  1.37s/it] 74%|███████▍  | 45844/61904 [1:15:36<6:06:52,  1.37s/it] 74%|███████▍  | 45845/61904 [1:15:37<5:58:05,  1.34s/it] 74%|███████▍  | 45846/61904 [1:15:39<6:05:15,  1.36s/it] 74%|███████▍  | 45847/61904 [1:15:40<5:56:05,  1.33s/it] 74%|███████▍  | 45848/61904 [1:15:41<5:58:58,  1.34s/it] 74%|███████▍  | 45849/61904 [1:15:43<6:00:55,  1.35s/it] 74%|███████▍  | 45850/61904 [1:15:44<6:00:30,  1.35s/it] 74%|███████▍  | 45851/61904 [1:15:45<5:59:44,  1.34s/it] 74%|███████▍  | 45852/61904 [1:15:47<6:07:38,  1.37s/it] 74%|███████▍  | 45853/61904 [1:15:48<6:07:25,  1.37s/it] 74%|███████▍  | 45854/61904 [1:15:50<6:10:55,  1.39s/it] 74%|███████▍  | 45855/61904 [1:15:51<6:05:23,  1.37s/it] 74%|███████▍  | 45856/61904 [1:15:52<6:04:11,  1.36s/it] 74%|███████▍  | 45857/61904 [1:15:54<5:59:03,  1.34s/it] 74%|███████▍  | 45858/61904 [1:15:55<5:49:33,  1.31s/it] 74%|███████▍  | 45859/61904 [1:15:56<5:59:50,  1.35s/it] 74%|███████▍  | 45860/61904 [1:15:58<6:11:28,  1.39s/it]                                                         {'loss': 2.5021, 'learning_rate': 1.2600155581485802e-07, 'epoch': 11.85}
 74%|███████▍  | 45860/61904 [1:15:58<6:11:28,  1.39s/it] 74%|███████▍  | 45861/61904 [1:15:59<6:17:18,  1.41s/it] 74%|███████▍  | 45862/61904 [1:16:01<6:16:10,  1.41s/it] 74%|███████▍  | 45863/61904 [1:16:02<6:10:25,  1.39s/it] 74%|███████▍  | 45864/61904 [1:16:03<6:00:54,  1.35s/it] 74%|███████▍  | 45865/61904 [1:16:05<6:02:20,  1.36s/it] 74%|███████▍  | 45866/61904 [1:16:06<5:57:39,  1.34s/it] 74%|███████▍  | 45867/61904 [1:16:07<5:59:36,  1.35s/it] 74%|███████▍  | 45868/61904 [1:16:09<5:59:41,  1.35s/it] 74%|███████▍  | 45869/61904 [1:16:10<5:53:05,  1.32s/it] 74%|███████▍  | 45870/61904 [1:16:11<5:54:49,  1.33s/it] 74%|███████▍  | 45871/61904 [1:16:12<5:55:34,  1.33s/it] 74%|███████▍  | 45872/61904 [1:16:14<6:04:35,  1.36s/it] 74%|███████▍  | 45873/61904 [1:16:15<5:57:46,  1.34s/it] 74%|███████▍  | 45874/61904 [1:16:17<6:09:28,  1.38s/it] 74%|███████▍  | 45875/61904 [1:16:18<6:09:24,  1.38s/it] 74%|███████▍  | 45876/61904 [1:16:19<6:07:56,  1.38s/it] 74%|███████▍  | 45877/61904 [1:16:21<6:05:09,  1.37s/it] 74%|███████▍  | 45878/61904 [1:16:22<6:02:47,  1.36s/it] 74%|███████▍  | 45879/61904 [1:16:23<5:57:29,  1.34s/it] 74%|███████▍  | 45880/61904 [1:16:25<5:56:56,  1.34s/it]                                                         {'loss': 2.5027, 'learning_rate': 1.2596914300531568e-07, 'epoch': 11.86}
 74%|███████▍  | 45880/61904 [1:16:25<5:56:56,  1.34s/it] 74%|███████▍  | 45881/61904 [1:16:26<6:01:05,  1.35s/it] 74%|███████▍  | 45882/61904 [1:16:27<5:54:43,  1.33s/it] 74%|███████▍  | 45883/61904 [1:16:29<5:58:11,  1.34s/it] 74%|███████▍  | 45884/61904 [1:16:30<6:01:13,  1.35s/it] 74%|███████▍  | 45885/61904 [1:16:31<6:00:18,  1.35s/it] 74%|███████▍  | 45886/61904 [1:16:33<6:10:38,  1.39s/it] 74%|███████▍  | 45887/61904 [1:16:34<6:11:27,  1.39s/it] 74%|███████▍  | 45888/61904 [1:16:36<5:56:03,  1.33s/it] 74%|███████▍  | 45889/61904 [1:16:37<5:54:13,  1.33s/it] 74%|███████▍  | 45890/61904 [1:16:38<5:57:41,  1.34s/it] 74%|███████▍  | 45891/61904 [1:16:40<6:09:04,  1.38s/it] 74%|███████▍  | 45892/61904 [1:16:41<6:22:07,  1.43s/it] 74%|███████▍  | 45893/61904 [1:16:43<6:22:29,  1.43s/it] 74%|███████▍  | 45894/61904 [1:16:44<6:10:02,  1.39s/it] 74%|███████▍  | 45895/61904 [1:16:45<6:02:24,  1.36s/it] 74%|███████▍  | 45896/61904 [1:16:47<5:56:32,  1.34s/it] 74%|███████▍  | 45897/61904 [1:16:48<5:59:40,  1.35s/it] 74%|███████▍  | 45898/61904 [1:16:49<5:58:08,  1.34s/it] 74%|███████▍  | 45899/61904 [1:16:51<5:55:46,  1.33s/it] 74%|███████▍  | 45900/61904 [1:16:52<6:24:46,  1.44s/it]                                                         {'loss': 2.4681, 'learning_rate': 1.2593673019577337e-07, 'epoch': 11.86}
 74%|███████▍  | 45900/61904 [1:16:52<6:24:46,  1.44s/it] 74%|███████▍  | 45901/61904 [1:16:54<6:15:26,  1.41s/it] 74%|███████▍  | 45902/61904 [1:16:55<6:04:40,  1.37s/it] 74%|███████▍  | 45903/61904 [1:16:56<5:53:15,  1.32s/it] 74%|███████▍  | 45904/61904 [1:16:57<5:53:22,  1.33s/it] 74%|███████▍  | 45905/61904 [1:16:59<6:17:25,  1.42s/it] 74%|███████▍  | 45906/61904 [1:17:00<6:14:57,  1.41s/it] 74%|███████▍  | 45907/61904 [1:17:02<6:02:00,  1.36s/it] 74%|███████▍  | 45908/61904 [1:17:03<5:59:22,  1.35s/it] 74%|███████▍  | 45909/61904 [1:17:04<6:07:53,  1.38s/it] 74%|███████▍  | 45910/61904 [1:17:06<6:01:00,  1.35s/it] 74%|███████▍  | 45911/61904 [1:17:07<6:04:49,  1.37s/it] 74%|███████▍  | 45912/61904 [1:17:08<6:01:42,  1.36s/it] 74%|███████▍  | 45913/61904 [1:17:10<5:57:05,  1.34s/it] 74%|███████▍  | 45914/61904 [1:17:11<5:55:32,  1.33s/it] 74%|███████▍  | 45915/61904 [1:17:12<5:57:53,  1.34s/it] 74%|███████▍  | 45916/61904 [1:17:14<6:05:07,  1.37s/it] 74%|███████▍  | 45917/61904 [1:17:15<6:10:08,  1.39s/it] 74%|███████▍  | 45918/61904 [1:17:17<6:02:50,  1.36s/it] 74%|███████▍  | 45919/61904 [1:17:18<5:54:13,  1.33s/it] 74%|███████▍  | 45920/61904 [1:17:19<5:57:58,  1.34s/it]                                                         {'loss': 2.409, 'learning_rate': 1.2590431738623104e-07, 'epoch': 11.87}
 74%|███████▍  | 45920/61904 [1:17:19<5:57:58,  1.34s/it] 74%|███████▍  | 45921/61904 [1:17:21<6:01:35,  1.36s/it] 74%|███████▍  | 45922/61904 [1:17:22<6:13:31,  1.40s/it] 74%|███████▍  | 45923/61904 [1:17:24<6:12:45,  1.40s/it] 74%|███████▍  | 45924/61904 [1:17:25<6:04:25,  1.37s/it] 74%|███████▍  | 45925/61904 [1:17:26<6:00:14,  1.35s/it] 74%|███████▍  | 45926/61904 [1:17:28<6:09:01,  1.39s/it] 74%|███████▍  | 45927/61904 [1:17:29<6:17:43,  1.42s/it] 74%|███████▍  | 45928/61904 [1:17:30<6:09:14,  1.39s/it] 74%|███████▍  | 45929/61904 [1:17:32<6:10:00,  1.39s/it] 74%|███████▍  | 45930/61904 [1:17:33<6:12:37,  1.40s/it] 74%|███████▍  | 45931/61904 [1:17:34<5:58:00,  1.34s/it] 74%|███████▍  | 45932/61904 [1:17:36<5:56:43,  1.34s/it] 74%|███████▍  | 45933/61904 [1:17:38<6:35:31,  1.49s/it] 74%|███████▍  | 45934/61904 [1:17:39<6:25:29,  1.45s/it] 74%|███████▍  | 45935/61904 [1:17:40<6:13:08,  1.40s/it] 74%|███████▍  | 45936/61904 [1:17:42<6:17:31,  1.42s/it] 74%|███████▍  | 45937/61904 [1:17:43<6:18:24,  1.42s/it] 74%|███████▍  | 45938/61904 [1:17:45<6:22:47,  1.44s/it] 74%|███████▍  | 45939/61904 [1:17:46<6:18:51,  1.42s/it] 74%|███████▍  | 45940/61904 [1:17:47<6:15:28,  1.41s/it]                                                         {'loss': 2.4426, 'learning_rate': 1.258719045766887e-07, 'epoch': 11.87}
 74%|███████▍  | 45940/61904 [1:17:47<6:15:28,  1.41s/it] 74%|███████▍  | 45941/61904 [1:17:49<6:21:37,  1.43s/it] 74%|███████▍  | 45942/61904 [1:17:50<6:20:45,  1.43s/it] 74%|███████▍  | 45943/61904 [1:17:52<6:13:10,  1.40s/it] 74%|███████▍  | 45944/61904 [1:17:53<6:18:09,  1.42s/it] 74%|███████▍  | 45945/61904 [1:17:55<6:27:15,  1.46s/it] 74%|███████▍  | 45946/61904 [1:17:56<6:04:45,  1.37s/it] 74%|███████▍  | 45947/61904 [1:17:57<6:01:21,  1.36s/it] 74%|███████▍  | 45948/61904 [1:17:59<6:08:08,  1.38s/it] 74%|███████▍  | 45949/61904 [1:18:00<6:09:53,  1.39s/it] 74%|███████▍  | 45950/61904 [1:18:01<6:12:53,  1.40s/it] 74%|███████▍  | 45951/61904 [1:18:03<6:10:07,  1.39s/it] 74%|███████▍  | 45952/61904 [1:18:04<6:04:16,  1.37s/it] 74%|███████▍  | 45953/61904 [1:18:06<6:14:25,  1.41s/it] 74%|███████▍  | 45954/61904 [1:18:07<6:09:50,  1.39s/it] 74%|███████▍  | 45955/61904 [1:18:09<6:29:09,  1.46s/it] 74%|███████▍  | 45956/61904 [1:18:10<6:21:51,  1.44s/it] 74%|███████▍  | 45957/61904 [1:18:12<6:30:39,  1.47s/it] 74%|███████▍  | 45958/61904 [1:18:13<6:33:49,  1.48s/it] 74%|███████▍  | 45959/61904 [1:18:14<6:30:43,  1.47s/it] 74%|███████▍  | 45960/61904 [1:18:16<6:15:02,  1.41s/it]                                                         {'loss': 2.4285, 'learning_rate': 1.2583949176714636e-07, 'epoch': 11.88}
 74%|███████▍  | 45960/61904 [1:18:16<6:15:02,  1.41s/it] 74%|███████▍  | 45961/61904 [1:18:17<5:57:59,  1.35s/it] 74%|███████▍  | 45962/61904 [1:18:18<6:00:39,  1.36s/it] 74%|███████▍  | 45963/61904 [1:18:20<6:08:35,  1.39s/it] 74%|███████▍  | 45964/61904 [1:18:21<6:02:22,  1.36s/it] 74%|███████▍  | 45965/61904 [1:18:23<6:10:41,  1.40s/it] 74%|███████▍  | 45966/61904 [1:18:24<6:11:04,  1.40s/it] 74%|███████▍  | 45967/61904 [1:18:25<6:06:33,  1.38s/it] 74%|███████▍  | 45968/61904 [1:18:27<6:00:49,  1.36s/it] 74%|███████▍  | 45969/61904 [1:18:28<6:03:17,  1.37s/it] 74%|███████▍  | 45970/61904 [1:18:30<6:12:42,  1.40s/it] 74%|███████▍  | 45971/61904 [1:18:31<6:08:34,  1.39s/it] 74%|███████▍  | 45972/61904 [1:18:32<6:09:33,  1.39s/it] 74%|███████▍  | 45973/61904 [1:18:34<6:07:22,  1.38s/it] 74%|███████▍  | 45974/61904 [1:18:35<6:04:18,  1.37s/it] 74%|███████▍  | 45975/61904 [1:18:36<5:51:34,  1.32s/it] 74%|███████▍  | 45976/61904 [1:18:37<5:46:36,  1.31s/it] 74%|███████▍  | 45977/61904 [1:18:39<5:55:06,  1.34s/it] 74%|███████▍  | 45978/61904 [1:18:40<6:08:36,  1.39s/it] 74%|███████▍  | 45979/61904 [1:18:42<6:11:55,  1.40s/it] 74%|███████▍  | 45980/61904 [1:18:43<6:21:38,  1.44s/it]                                                         {'loss': 2.4452, 'learning_rate': 1.2580707895760405e-07, 'epoch': 11.88}
 74%|███████▍  | 45980/61904 [1:18:43<6:21:38,  1.44s/it] 74%|███████▍  | 45981/61904 [1:18:45<6:09:53,  1.39s/it] 74%|███████▍  | 45982/61904 [1:18:46<6:07:38,  1.39s/it] 74%|███████▍  | 45983/61904 [1:18:47<6:04:14,  1.37s/it] 74%|███████▍  | 45984/61904 [1:18:49<6:01:59,  1.36s/it] 74%|███████▍  | 45985/61904 [1:18:50<6:04:05,  1.37s/it] 74%|███████▍  | 45986/61904 [1:18:51<5:50:55,  1.32s/it] 74%|███████▍  | 45987/61904 [1:18:53<5:48:34,  1.31s/it] 74%|███████▍  | 45988/61904 [1:18:54<5:39:56,  1.28s/it] 74%|███████▍  | 45989/61904 [1:18:55<5:53:52,  1.33s/it] 74%|███████▍  | 45990/61904 [1:18:56<5:44:59,  1.30s/it] 74%|███████▍  | 45991/61904 [1:18:58<6:02:24,  1.37s/it] 74%|███████▍  | 45992/61904 [1:18:59<6:03:41,  1.37s/it] 74%|███████▍  | 45993/61904 [1:19:01<5:54:02,  1.34s/it] 74%|███████▍  | 45994/61904 [1:19:02<5:55:13,  1.34s/it] 74%|███████▍  | 45995/61904 [1:19:03<5:55:49,  1.34s/it] 74%|███████▍  | 45996/61904 [1:19:05<6:00:20,  1.36s/it] 74%|███████▍  | 45997/61904 [1:19:06<5:54:09,  1.34s/it] 74%|███████▍  | 45998/61904 [1:19:07<5:57:16,  1.35s/it] 74%|███████▍  | 45999/61904 [1:19:09<5:59:22,  1.36s/it] 74%|███████▍  | 46000/61904 [1:19:10<5:51:48,  1.33s/it]                                                         {'loss': 2.4816, 'learning_rate': 1.257746661480617e-07, 'epoch': 11.89}
 74%|███████▍  | 46000/61904 [1:19:10<5:51:48,  1.33s/it] 74%|███████▍  | 46001/61904 [1:19:11<5:54:11,  1.34s/it] 74%|███████▍  | 46002/61904 [1:19:13<5:47:57,  1.31s/it] 74%|███████▍  | 46003/61904 [1:19:14<5:42:47,  1.29s/it] 74%|███████▍  | 46004/61904 [1:19:15<5:35:39,  1.27s/it] 74%|███████▍  | 46005/61904 [1:19:16<5:42:58,  1.29s/it] 74%|███████▍  | 46006/61904 [1:19:18<6:04:19,  1.37s/it] 74%|███████▍  | 46007/61904 [1:19:19<5:58:10,  1.35s/it] 74%|███████▍  | 46008/61904 [1:19:21<6:28:46,  1.47s/it] 74%|███████▍  | 46009/61904 [1:19:23<6:32:17,  1.48s/it] 74%|███████▍  | 46010/61904 [1:19:24<6:38:30,  1.50s/it] 74%|███████▍  | 46011/61904 [1:19:25<6:21:35,  1.44s/it] 74%|███████▍  | 46012/61904 [1:19:27<6:28:30,  1.47s/it] 74%|███████▍  | 46013/61904 [1:19:28<6:13:27,  1.41s/it] 74%|███████▍  | 46014/61904 [1:19:29<6:01:09,  1.36s/it] 74%|███████▍  | 46015/61904 [1:19:31<5:52:08,  1.33s/it] 74%|███████▍  | 46016/61904 [1:19:32<5:51:07,  1.33s/it] 74%|███████▍  | 46017/61904 [1:19:33<5:59:38,  1.36s/it] 74%|███████▍  | 46018/61904 [1:19:35<6:04:02,  1.37s/it] 74%|███████▍  | 46019/61904 [1:19:36<5:59:53,  1.36s/it] 74%|███████▍  | 46020/61904 [1:19:37<5:52:05,  1.33s/it]                                                         {'loss': 2.4585, 'learning_rate': 1.2574225333851937e-07, 'epoch': 11.89}
 74%|███████▍  | 46020/61904 [1:19:37<5:52:05,  1.33s/it] 74%|███████▍  | 46021/61904 [1:19:39<5:56:09,  1.35s/it] 74%|███████▍  | 46022/61904 [1:19:40<5:55:32,  1.34s/it] 74%|███████▍  | 46023/61904 [1:19:42<6:02:15,  1.37s/it] 74%|███████▍  | 46024/61904 [1:19:43<6:07:14,  1.39s/it] 74%|███████▍  | 46025/61904 [1:19:44<5:54:42,  1.34s/it] 74%|███████▍  | 46026/61904 [1:19:45<5:47:26,  1.31s/it] 74%|███████▍  | 46027/61904 [1:19:47<5:58:30,  1.35s/it] 74%|███████▍  | 46028/61904 [1:19:48<6:01:48,  1.37s/it] 74%|███████▍  | 46029/61904 [1:19:50<6:04:23,  1.38s/it] 74%|███████▍  | 46030/61904 [1:19:51<5:56:51,  1.35s/it] 74%|███████▍  | 46031/61904 [1:19:53<6:09:53,  1.40s/it] 74%|███████▍  | 46032/61904 [1:19:54<5:58:24,  1.35s/it] 74%|███████▍  | 46033/61904 [1:19:55<5:58:14,  1.35s/it] 74%|███████▍  | 46034/61904 [1:19:56<5:56:25,  1.35s/it] 74%|███████▍  | 46035/61904 [1:19:58<5:53:26,  1.34s/it] 74%|███████▍  | 46036/61904 [1:19:59<6:03:49,  1.38s/it] 74%|███████▍  | 46037/61904 [1:20:01<5:56:39,  1.35s/it] 74%|███████▍  | 46038/61904 [1:20:02<6:05:13,  1.38s/it] 74%|███████▍  | 46039/61904 [1:20:03<6:10:56,  1.40s/it] 74%|███████▍  | 46040/61904 [1:20:05<6:13:57,  1.41s/it]                                                         {'loss': 2.4171, 'learning_rate': 1.2570984052897706e-07, 'epoch': 11.9}
 74%|███████▍  | 46040/61904 [1:20:05<6:13:57,  1.41s/it] 74%|███████▍  | 46041/61904 [1:20:06<6:00:19,  1.36s/it] 74%|███████▍  | 46042/61904 [1:20:07<5:55:05,  1.34s/it] 74%|███████▍  | 46043/61904 [1:20:09<5:50:09,  1.32s/it] 74%|███████▍  | 46044/61904 [1:20:10<5:51:17,  1.33s/it] 74%|███████▍  | 46045/61904 [1:20:11<5:41:29,  1.29s/it] 74%|███████▍  | 46046/61904 [1:20:13<5:40:25,  1.29s/it] 74%|███████▍  | 46047/61904 [1:20:14<5:59:46,  1.36s/it] 74%|███████▍  | 46048/61904 [1:20:16<6:05:47,  1.38s/it] 74%|███████▍  | 46049/61904 [1:20:17<5:54:53,  1.34s/it] 74%|███████▍  | 46050/61904 [1:20:18<5:55:36,  1.35s/it] 74%|███████▍  | 46051/61904 [1:20:19<5:50:50,  1.33s/it] 74%|███████▍  | 46052/61904 [1:20:21<5:53:41,  1.34s/it] 74%|███████▍  | 46053/61904 [1:20:22<5:51:02,  1.33s/it] 74%|███████▍  | 46054/61904 [1:20:23<5:51:19,  1.33s/it] 74%|███████▍  | 46055/61904 [1:20:25<5:53:06,  1.34s/it] 74%|███████▍  | 46056/61904 [1:20:26<5:54:31,  1.34s/it] 74%|███████▍  | 46057/61904 [1:20:27<5:43:39,  1.30s/it] 74%|███████▍  | 46058/61904 [1:20:29<5:55:42,  1.35s/it] 74%|███████▍  | 46059/61904 [1:20:30<5:53:36,  1.34s/it] 74%|███████▍  | 46060/61904 [1:20:31<5:57:55,  1.36s/it]                                                         {'loss': 2.4597, 'learning_rate': 1.2567742771943472e-07, 'epoch': 11.9}
 74%|███████▍  | 46060/61904 [1:20:31<5:57:55,  1.36s/it] 74%|███████▍  | 46061/61904 [1:20:33<5:57:23,  1.35s/it] 74%|███████▍  | 46062/61904 [1:20:34<5:53:55,  1.34s/it] 74%|███████▍  | 46063/61904 [1:20:36<6:17:17,  1.43s/it] 74%|███████▍  | 46064/61904 [1:20:37<6:04:45,  1.38s/it] 74%|███████▍  | 46065/61904 [1:20:38<6:09:16,  1.40s/it] 74%|███████▍  | 46066/61904 [1:20:40<6:13:46,  1.42s/it] 74%|███████▍  | 46067/61904 [1:20:41<6:04:51,  1.38s/it] 74%|███████▍  | 46068/61904 [1:20:42<5:55:12,  1.35s/it] 74%|███████▍  | 46069/61904 [1:20:44<5:58:00,  1.36s/it] 74%|███████▍  | 46070/61904 [1:20:45<5:58:48,  1.36s/it] 74%|███████▍  | 46071/61904 [1:20:47<6:03:48,  1.38s/it] 74%|███████▍  | 46072/61904 [1:20:48<6:08:51,  1.40s/it] 74%|███████▍  | 46073/61904 [1:20:50<6:08:47,  1.40s/it] 74%|███████▍  | 46074/61904 [1:20:51<6:07:59,  1.39s/it] 74%|███████▍  | 46075/61904 [1:20:52<5:59:28,  1.36s/it] 74%|███████▍  | 46076/61904 [1:20:54<6:05:55,  1.39s/it] 74%|███████▍  | 46077/61904 [1:20:55<6:05:09,  1.38s/it] 74%|███████▍  | 46078/61904 [1:20:57<6:16:07,  1.43s/it] 74%|███████▍  | 46079/61904 [1:20:58<6:09:31,  1.40s/it] 74%|███████▍  | 46080/61904 [1:20:59<6:13:28,  1.42s/it]                                                         {'loss': 2.4195, 'learning_rate': 1.2564501490989238e-07, 'epoch': 11.91}
 74%|███████▍  | 46080/61904 [1:20:59<6:13:28,  1.42s/it] 74%|███████▍  | 46081/61904 [1:21:01<6:04:42,  1.38s/it] 74%|███████▍  | 46082/61904 [1:21:02<5:55:52,  1.35s/it] 74%|███████▍  | 46083/61904 [1:21:03<5:57:29,  1.36s/it] 74%|███████▍  | 46084/61904 [1:21:05<6:03:28,  1.38s/it] 74%|███████▍  | 46085/61904 [1:21:06<6:02:57,  1.38s/it] 74%|███████▍  | 46086/61904 [1:21:07<5:57:39,  1.36s/it] 74%|███████▍  | 46087/61904 [1:21:09<6:02:47,  1.38s/it] 74%|███████▍  | 46088/61904 [1:21:10<6:10:57,  1.41s/it] 74%|███████▍  | 46089/61904 [1:21:12<6:21:46,  1.45s/it] 74%|███████▍  | 46090/61904 [1:21:13<6:21:38,  1.45s/it] 74%|███████▍  | 46091/61904 [1:21:15<6:12:00,  1.41s/it] 74%|███████▍  | 46092/61904 [1:21:16<6:00:56,  1.37s/it] 74%|███████▍  | 46093/61904 [1:21:17<5:53:32,  1.34s/it] 74%|███████▍  | 46094/61904 [1:21:18<5:53:38,  1.34s/it] 74%|███████▍  | 46095/61904 [1:21:20<5:46:42,  1.32s/it] 74%|███████▍  | 46096/61904 [1:21:21<5:56:56,  1.35s/it] 74%|███████▍  | 46097/61904 [1:21:23<5:57:32,  1.36s/it] 74%|███████▍  | 46098/61904 [1:21:24<5:56:38,  1.35s/it] 74%|███████▍  | 46099/61904 [1:21:25<5:52:47,  1.34s/it] 74%|███████▍  | 46100/61904 [1:21:27<5:57:22,  1.36s/it]                                                         {'loss': 2.5034, 'learning_rate': 1.2561260210035004e-07, 'epoch': 11.92}
 74%|███████▍  | 46100/61904 [1:21:27<5:57:22,  1.36s/it] 74%|███████▍  | 46101/61904 [1:21:28<6:01:25,  1.37s/it] 74%|███████▍  | 46102/61904 [1:21:29<5:53:35,  1.34s/it] 74%|███████▍  | 46103/61904 [1:21:31<5:53:33,  1.34s/it] 74%|███████▍  | 46104/61904 [1:21:32<5:57:49,  1.36s/it] 74%|███████▍  | 46105/61904 [1:21:33<5:58:04,  1.36s/it] 74%|███████▍  | 46106/61904 [1:21:35<6:10:51,  1.41s/it] 74%|███████▍  | 46107/61904 [1:21:36<6:14:00,  1.42s/it] 74%|███████▍  | 46108/61904 [1:21:38<6:08:53,  1.40s/it] 74%|███████▍  | 46109/61904 [1:21:39<6:04:57,  1.39s/it] 74%|███████▍  | 46110/61904 [1:21:40<5:55:02,  1.35s/it] 74%|███████▍  | 46111/61904 [1:21:42<5:51:45,  1.34s/it] 74%|███████▍  | 46112/61904 [1:21:43<5:53:55,  1.34s/it] 74%|███████▍  | 46113/61904 [1:21:44<5:52:24,  1.34s/it] 74%|███████▍  | 46114/61904 [1:21:46<5:54:38,  1.35s/it] 74%|███████▍  | 46115/61904 [1:21:47<5:52:50,  1.34s/it] 74%|███████▍  | 46116/61904 [1:21:48<5:53:24,  1.34s/it] 74%|███████▍  | 46117/61904 [1:21:50<5:59:20,  1.37s/it] 74%|███████▍  | 46118/61904 [1:21:51<5:57:21,  1.36s/it] 75%|███████▍  | 46119/61904 [1:21:52<5:51:41,  1.34s/it] 75%|███████▍  | 46120/61904 [1:21:54<5:50:20,  1.33s/it]                                                         {'loss': 2.4407, 'learning_rate': 1.2558018929080773e-07, 'epoch': 11.92}
 75%|███████▍  | 46120/61904 [1:21:54<5:50:20,  1.33s/it] 75%|███████▍  | 46121/61904 [1:21:55<5:57:09,  1.36s/it] 75%|███████▍  | 46122/61904 [1:21:57<6:05:08,  1.39s/it] 75%|███████▍  | 46123/61904 [1:21:58<6:04:05,  1.38s/it] 75%|███████▍  | 46124/61904 [1:21:59<5:59:14,  1.37s/it] 75%|███████▍  | 46125/61904 [1:22:01<5:46:32,  1.32s/it] 75%|███████▍  | 46126/61904 [1:22:02<5:54:55,  1.35s/it] 75%|███████▍  | 46127/61904 [1:22:03<5:59:06,  1.37s/it] 75%|███████▍  | 46128/61904 [1:22:05<6:01:30,  1.37s/it] 75%|███████▍  | 46129/61904 [1:22:06<6:10:23,  1.41s/it] 75%|███████▍  | 46130/61904 [1:22:08<6:05:56,  1.39s/it] 75%|███████▍  | 46131/61904 [1:22:09<6:06:48,  1.40s/it] 75%|███████▍  | 46132/61904 [1:22:10<6:08:55,  1.40s/it] 75%|███████▍  | 46133/61904 [1:22:12<6:00:01,  1.37s/it] 75%|███████▍  | 46134/61904 [1:22:13<5:58:05,  1.36s/it] 75%|███████▍  | 46135/61904 [1:22:14<5:49:56,  1.33s/it] 75%|███████▍  | 46136/61904 [1:22:16<5:54:29,  1.35s/it] 75%|███████▍  | 46137/61904 [1:22:17<5:50:38,  1.33s/it] 75%|███████▍  | 46138/61904 [1:22:18<5:56:55,  1.36s/it] 75%|███████▍  | 46139/61904 [1:22:20<5:51:33,  1.34s/it] 75%|███████▍  | 46140/61904 [1:22:21<5:49:06,  1.33s/it]                                                         {'loss': 2.4813, 'learning_rate': 1.255477764812654e-07, 'epoch': 11.93}
 75%|███████▍  | 46140/61904 [1:22:21<5:49:06,  1.33s/it] 75%|███████▍  | 46141/61904 [1:22:23<6:07:11,  1.40s/it] 75%|███████▍  | 46142/61904 [1:22:24<6:03:20,  1.38s/it] 75%|███████▍  | 46143/61904 [1:22:25<5:59:21,  1.37s/it] 75%|███████▍  | 46144/61904 [1:22:27<6:05:23,  1.39s/it] 75%|███████▍  | 46145/61904 [1:22:28<5:54:41,  1.35s/it] 75%|███████▍  | 46146/61904 [1:22:29<6:00:19,  1.37s/it] 75%|███████▍  | 46147/61904 [1:22:31<6:05:15,  1.39s/it] 75%|███████▍  | 46148/61904 [1:22:32<6:03:35,  1.38s/it] 75%|███████▍  | 46149/61904 [1:22:34<6:14:21,  1.43s/it] 75%|███████▍  | 46150/61904 [1:22:35<6:18:41,  1.44s/it] 75%|███████▍  | 46151/61904 [1:22:37<6:13:38,  1.42s/it] 75%|███████▍  | 46152/61904 [1:22:38<6:07:32,  1.40s/it] 75%|███████▍  | 46153/61904 [1:22:39<6:07:27,  1.40s/it] 75%|███████▍  | 46154/61904 [1:22:41<6:01:59,  1.38s/it] 75%|███████▍  | 46155/61904 [1:22:42<6:04:30,  1.39s/it] 75%|███████▍  | 46156/61904 [1:22:43<6:04:11,  1.39s/it] 75%|███████▍  | 46157/61904 [1:22:45<6:01:48,  1.38s/it] 75%|███████▍  | 46158/61904 [1:22:46<6:04:23,  1.39s/it] 75%|███████▍  | 46159/61904 [1:22:48<6:00:17,  1.37s/it] 75%|███████▍  | 46160/61904 [1:22:49<6:03:29,  1.39s/it]                                                         {'loss': 2.4599, 'learning_rate': 1.2551536367172306e-07, 'epoch': 11.93}
 75%|███████▍  | 46160/61904 [1:22:49<6:03:29,  1.39s/it] 75%|███████▍  | 46161/61904 [1:22:50<6:04:18,  1.39s/it] 75%|███████▍  | 46162/61904 [1:22:52<5:56:16,  1.36s/it] 75%|███████▍  | 46163/61904 [1:22:53<5:47:51,  1.33s/it] 75%|███████▍  | 46164/61904 [1:22:54<5:43:59,  1.31s/it] 75%|███████▍  | 46165/61904 [1:22:55<5:38:37,  1.29s/it] 75%|███████▍  | 46166/61904 [1:22:57<5:53:29,  1.35s/it] 75%|███████▍  | 46167/61904 [1:22:58<5:55:29,  1.36s/it] 75%|███████▍  | 46168/61904 [1:23:00<5:59:48,  1.37s/it] 75%|███████▍  | 46169/61904 [1:23:01<5:56:27,  1.36s/it] 75%|███████▍  | 46170/61904 [1:23:02<5:45:20,  1.32s/it] 75%|███████▍  | 46171/61904 [1:23:03<5:42:20,  1.31s/it] 75%|███████▍  | 46172/61904 [1:23:05<5:44:03,  1.31s/it] 75%|███████▍  | 46173/61904 [1:23:06<5:51:08,  1.34s/it] 75%|███████▍  | 46174/61904 [1:23:08<6:04:33,  1.39s/it] 75%|███████▍  | 46175/61904 [1:23:09<6:07:02,  1.40s/it] 75%|███████▍  | 46176/61904 [1:23:11<6:05:43,  1.40s/it] 75%|███████▍  | 46177/61904 [1:23:12<6:09:42,  1.41s/it] 75%|███████▍  | 46178/61904 [1:23:13<6:12:09,  1.42s/it] 75%|███████▍  | 46179/61904 [1:23:15<6:01:37,  1.38s/it] 75%|███████▍  | 46180/61904 [1:23:16<6:06:32,  1.40s/it]                                                         {'loss': 2.4641, 'learning_rate': 1.2548295086218072e-07, 'epoch': 11.94}
 75%|███████▍  | 46180/61904 [1:23:16<6:06:32,  1.40s/it] 75%|███████▍  | 46181/61904 [1:23:17<5:59:14,  1.37s/it] 75%|███████▍  | 46182/61904 [1:23:19<5:54:51,  1.35s/it] 75%|███████▍  | 46183/61904 [1:23:20<5:49:06,  1.33s/it] 75%|███████▍  | 46184/61904 [1:23:22<6:00:34,  1.38s/it] 75%|███████▍  | 46185/61904 [1:23:23<6:12:44,  1.42s/it] 75%|███████▍  | 46186/61904 [1:23:24<6:11:10,  1.42s/it] 75%|███████▍  | 46187/61904 [1:23:26<5:57:16,  1.36s/it] 75%|███████▍  | 46188/61904 [1:23:27<5:46:53,  1.32s/it] 75%|███████▍  | 46189/61904 [1:23:28<5:57:13,  1.36s/it] 75%|███████▍  | 46190/61904 [1:23:30<6:00:52,  1.38s/it] 75%|███████▍  | 46191/61904 [1:23:31<5:58:24,  1.37s/it] 75%|███████▍  | 46192/61904 [1:23:33<5:56:38,  1.36s/it] 75%|███████▍  | 46193/61904 [1:23:34<5:54:04,  1.35s/it] 75%|███████▍  | 46194/61904 [1:23:35<6:03:23,  1.39s/it] 75%|███████▍  | 46195/61904 [1:23:37<6:02:47,  1.39s/it] 75%|███████▍  | 46196/61904 [1:23:38<5:59:45,  1.37s/it] 75%|███████▍  | 46197/61904 [1:23:40<6:15:46,  1.44s/it] 75%|███████▍  | 46198/61904 [1:23:41<6:04:47,  1.39s/it] 75%|███████▍  | 46199/61904 [1:23:42<5:55:22,  1.36s/it] 75%|███████▍  | 46200/61904 [1:23:44<5:53:28,  1.35s/it]                                                         {'loss': 2.5262, 'learning_rate': 1.254505380526384e-07, 'epoch': 11.94}
 75%|███████▍  | 46200/61904 [1:23:44<5:53:28,  1.35s/it] 75%|███████▍  | 46201/61904 [1:23:45<6:00:03,  1.38s/it] 75%|███████▍  | 46202/61904 [1:23:46<6:03:43,  1.39s/it] 75%|███████▍  | 46203/61904 [1:23:48<5:55:59,  1.36s/it] 75%|███████▍  | 46204/61904 [1:23:49<5:57:02,  1.36s/it] 75%|███████▍  | 46205/61904 [1:23:50<6:00:51,  1.38s/it] 75%|███████▍  | 46206/61904 [1:23:52<6:03:25,  1.39s/it] 75%|███████▍  | 46207/61904 [1:23:53<6:00:29,  1.38s/it] 75%|███████▍  | 46208/61904 [1:23:54<5:52:20,  1.35s/it] 75%|███████▍  | 46209/61904 [1:23:56<5:46:44,  1.33s/it] 75%|███████▍  | 46210/61904 [1:23:57<5:43:47,  1.31s/it] 75%|███████▍  | 46211/61904 [1:23:58<5:46:06,  1.32s/it] 75%|███████▍  | 46212/61904 [1:24:00<5:49:00,  1.33s/it] 75%|███████▍  | 46213/61904 [1:24:01<5:50:04,  1.34s/it] 75%|███████▍  | 46214/61904 [1:24:02<5:53:57,  1.35s/it] 75%|███████▍  | 46215/61904 [1:24:04<6:07:01,  1.40s/it] 75%|███████▍  | 46216/61904 [1:24:05<6:03:32,  1.39s/it] 75%|███████▍  | 46217/61904 [1:24:07<6:09:03,  1.41s/it] 75%|███████▍  | 46218/61904 [1:24:08<6:16:01,  1.44s/it] 75%|███████▍  | 46219/61904 [1:24:10<6:07:03,  1.40s/it] 75%|███████▍  | 46220/61904 [1:24:11<6:04:33,  1.39s/it]                                                         {'loss': 2.4518, 'learning_rate': 1.2541812524309607e-07, 'epoch': 11.95}
 75%|███████▍  | 46220/61904 [1:24:11<6:04:33,  1.39s/it] 75%|███████▍  | 46221/61904 [1:24:12<6:03:30,  1.39s/it] 75%|███████▍  | 46222/61904 [1:24:14<5:51:09,  1.34s/it] 75%|███████▍  | 46223/61904 [1:24:15<5:55:03,  1.36s/it] 75%|███████▍  | 46224/61904 [1:24:16<5:46:53,  1.33s/it] 75%|███████▍  | 46225/61904 [1:24:18<5:55:52,  1.36s/it] 75%|███████▍  | 46226/61904 [1:24:19<6:03:49,  1.39s/it] 75%|███████▍  | 46227/61904 [1:24:21<6:01:28,  1.38s/it] 75%|███████▍  | 46228/61904 [1:24:22<5:56:41,  1.37s/it] 75%|███████▍  | 46229/61904 [1:24:23<5:55:36,  1.36s/it] 75%|███████▍  | 46230/61904 [1:24:25<6:09:17,  1.41s/it] 75%|███████▍  | 46231/61904 [1:24:26<6:32:44,  1.50s/it] 75%|███████▍  | 46232/61904 [1:24:28<6:30:42,  1.50s/it] 75%|███████▍  | 46233/61904 [1:24:29<6:26:31,  1.48s/it] 75%|███████▍  | 46234/61904 [1:24:31<6:11:18,  1.42s/it] 75%|███████▍  | 46235/61904 [1:24:32<6:15:48,  1.44s/it] 75%|███████▍  | 46236/61904 [1:24:34<6:14:07,  1.43s/it] 75%|███████▍  | 46237/61904 [1:24:35<6:06:51,  1.40s/it] 75%|███████▍  | 46238/61904 [1:24:36<6:10:38,  1.42s/it] 75%|███████▍  | 46239/61904 [1:24:38<5:59:33,  1.38s/it] 75%|███████▍  | 46240/61904 [1:24:39<6:03:14,  1.39s/it]                                                         {'loss': 2.5018, 'learning_rate': 1.2538571243355373e-07, 'epoch': 11.95}
 75%|███████▍  | 46240/61904 [1:24:39<6:03:14,  1.39s/it] 75%|███████▍  | 46241/61904 [1:24:40<5:54:57,  1.36s/it] 75%|███████▍  | 46242/61904 [1:24:42<6:00:03,  1.38s/it] 75%|███████▍  | 46243/61904 [1:24:43<6:06:44,  1.41s/it] 75%|███████▍  | 46244/61904 [1:24:45<5:53:31,  1.35s/it] 75%|███████▍  | 46245/61904 [1:24:46<6:13:02,  1.43s/it] 75%|███████▍  | 46246/61904 [1:24:47<6:01:26,  1.39s/it] 75%|███████▍  | 46247/61904 [1:24:49<6:02:39,  1.39s/it] 75%|███████▍  | 46248/61904 [1:24:50<6:07:17,  1.41s/it] 75%|███████▍  | 46249/61904 [1:24:51<5:55:44,  1.36s/it] 75%|███████▍  | 46250/61904 [1:24:53<5:53:22,  1.35s/it] 75%|███████▍  | 46251/61904 [1:24:54<6:16:27,  1.44s/it] 75%|███████▍  | 46252/61904 [1:24:56<6:05:45,  1.40s/it] 75%|███████▍  | 46253/61904 [1:24:57<5:52:48,  1.35s/it] 75%|███████▍  | 46254/61904 [1:24:58<5:54:40,  1.36s/it] 75%|███████▍  | 46255/61904 [1:25:00<6:13:23,  1.43s/it] 75%|███████▍  | 46256/61904 [1:25:01<6:11:30,  1.42s/it] 75%|███████▍  | 46257/61904 [1:25:03<6:05:29,  1.40s/it] 75%|███████▍  | 46258/61904 [1:25:04<6:12:04,  1.43s/it] 75%|███████▍  | 46259/61904 [1:25:06<6:13:54,  1.43s/it] 75%|███████▍  | 46260/61904 [1:25:07<6:07:32,  1.41s/it]                                                         {'loss': 2.4634, 'learning_rate': 1.253532996240114e-07, 'epoch': 11.96}
 75%|███████▍  | 46260/61904 [1:25:07<6:07:32,  1.41s/it] 75%|███████▍  | 46261/61904 [1:25:08<5:59:46,  1.38s/it] 75%|███████▍  | 46262/61904 [1:25:10<5:58:16,  1.37s/it] 75%|███████▍  | 46263/61904 [1:25:11<5:52:19,  1.35s/it] 75%|███████▍  | 46264/61904 [1:25:12<5:43:03,  1.32s/it] 75%|███████▍  | 46265/61904 [1:25:14<5:47:34,  1.33s/it] 75%|███████▍  | 46266/61904 [1:25:15<5:51:57,  1.35s/it] 75%|███████▍  | 46267/61904 [1:25:16<5:52:26,  1.35s/it] 75%|███████▍  | 46268/61904 [1:25:18<5:56:05,  1.37s/it] 75%|███████▍  | 46269/61904 [1:25:19<6:09:00,  1.42s/it] 75%|███████▍  | 46270/61904 [1:25:21<6:18:21,  1.45s/it] 75%|███████▍  | 46271/61904 [1:25:22<6:05:52,  1.40s/it] 75%|███████▍  | 46272/61904 [1:25:23<5:56:25,  1.37s/it] 75%|███████▍  | 46273/61904 [1:25:25<5:56:01,  1.37s/it] 75%|███████▍  | 46274/61904 [1:25:26<6:01:08,  1.39s/it] 75%|███████▍  | 46275/61904 [1:25:28<6:03:06,  1.39s/it] 75%|███████▍  | 46276/61904 [1:25:29<6:11:41,  1.43s/it] 75%|███████▍  | 46277/61904 [1:25:31<6:13:50,  1.44s/it] 75%|███████▍  | 46278/61904 [1:25:32<6:14:39,  1.44s/it] 75%|███████▍  | 46279/61904 [1:25:33<6:08:08,  1.41s/it] 75%|███████▍  | 46280/61904 [1:25:35<6:01:34,  1.39s/it]                                                         {'loss': 2.4889, 'learning_rate': 1.2532088681446908e-07, 'epoch': 11.96}
 75%|███████▍  | 46280/61904 [1:25:35<6:01:34,  1.39s/it] 75%|███████▍  | 46281/61904 [1:25:36<6:06:58,  1.41s/it] 75%|███████▍  | 46282/61904 [1:25:37<5:55:39,  1.37s/it] 75%|███████▍  | 46283/61904 [1:25:39<6:02:13,  1.39s/it] 75%|███████▍  | 46284/61904 [1:25:40<6:03:21,  1.40s/it] 75%|███████▍  | 46285/61904 [1:25:42<6:02:42,  1.39s/it] 75%|███████▍  | 46286/61904 [1:25:43<5:50:49,  1.35s/it] 75%|███████▍  | 46287/61904 [1:25:44<5:46:25,  1.33s/it] 75%|███████▍  | 46288/61904 [1:25:46<5:48:01,  1.34s/it] 75%|███████▍  | 46289/61904 [1:25:47<5:58:44,  1.38s/it] 75%|███████▍  | 46290/61904 [1:25:49<6:26:58,  1.49s/it] 75%|███████▍  | 46291/61904 [1:25:50<6:22:25,  1.47s/it] 75%|███████▍  | 46292/61904 [1:25:52<6:19:55,  1.46s/it] 75%|███████▍  | 46293/61904 [1:25:53<6:18:01,  1.45s/it] 75%|███████▍  | 46294/61904 [1:25:55<6:17:34,  1.45s/it] 75%|███████▍  | 46295/61904 [1:25:56<6:18:45,  1.46s/it] 75%|███████▍  | 46296/61904 [1:25:57<6:03:10,  1.40s/it] 75%|███████▍  | 46297/61904 [1:25:59<5:57:23,  1.37s/it] 75%|███████▍  | 46298/61904 [1:26:00<5:45:05,  1.33s/it] 75%|███████▍  | 46299/61904 [1:26:01<5:43:50,  1.32s/it] 75%|███████▍  | 46300/61904 [1:26:02<5:40:41,  1.31s/it]                                                         {'loss': 2.4577, 'learning_rate': 1.2528847400492674e-07, 'epoch': 11.97}
 75%|███████▍  | 46300/61904 [1:26:02<5:40:41,  1.31s/it] 75%|███████▍  | 46301/61904 [1:26:04<5:36:51,  1.30s/it] 75%|███████▍  | 46302/61904 [1:26:05<5:37:48,  1.30s/it] 75%|███████▍  | 46303/61904 [1:26:06<5:43:48,  1.32s/it] 75%|███████▍  | 46304/61904 [1:26:08<5:39:30,  1.31s/it] 75%|███████▍  | 46305/61904 [1:26:09<5:40:47,  1.31s/it] 75%|███████▍  | 46306/61904 [1:26:10<5:47:37,  1.34s/it] 75%|███████▍  | 46307/61904 [1:26:12<5:47:24,  1.34s/it] 75%|███████▍  | 46308/61904 [1:26:13<5:43:53,  1.32s/it] 75%|███████▍  | 46309/61904 [1:26:14<5:52:19,  1.36s/it] 75%|███████▍  | 46310/61904 [1:26:16<5:49:10,  1.34s/it] 75%|███████▍  | 46311/61904 [1:26:17<5:54:56,  1.37s/it] 75%|███████▍  | 46312/61904 [1:26:19<6:03:04,  1.40s/it] 75%|███████▍  | 46313/61904 [1:26:20<6:02:52,  1.40s/it] 75%|███████▍  | 46314/61904 [1:26:21<5:56:34,  1.37s/it] 75%|███████▍  | 46315/61904 [1:26:23<5:48:45,  1.34s/it] 75%|███████▍  | 46316/61904 [1:26:24<5:53:24,  1.36s/it] 75%|███████▍  | 46317/61904 [1:26:25<5:50:55,  1.35s/it] 75%|███████▍  | 46318/61904 [1:26:27<5:49:40,  1.35s/it] 75%|███████▍  | 46319/61904 [1:26:28<5:56:09,  1.37s/it] 75%|███████▍  | 46320/61904 [1:26:29<5:57:44,  1.38s/it]                                                         {'loss': 2.4812, 'learning_rate': 1.252560611953844e-07, 'epoch': 11.97}
 75%|███████▍  | 46320/61904 [1:26:29<5:57:44,  1.38s/it] 75%|███████▍  | 46321/61904 [1:26:31<6:06:32,  1.41s/it] 75%|███████▍  | 46322/61904 [1:26:32<6:11:32,  1.43s/it] 75%|███████▍  | 46323/61904 [1:26:34<5:59:38,  1.38s/it] 75%|███████▍  | 46324/61904 [1:26:35<6:04:43,  1.40s/it] 75%|███████▍  | 46325/61904 [1:26:36<5:55:31,  1.37s/it] 75%|███████▍  | 46326/61904 [1:26:38<5:51:54,  1.36s/it] 75%|███████▍  | 46327/61904 [1:26:39<5:44:12,  1.33s/it] 75%|███████▍  | 46328/61904 [1:26:41<6:00:08,  1.39s/it] 75%|███████▍  | 46329/61904 [1:26:42<5:48:25,  1.34s/it] 75%|███████▍  | 46330/61904 [1:26:43<5:53:06,  1.36s/it] 75%|███████▍  | 46331/61904 [1:26:45<5:54:11,  1.36s/it] 75%|███████▍  | 46332/61904 [1:26:46<5:47:57,  1.34s/it] 75%|███████▍  | 46333/61904 [1:26:47<6:05:48,  1.41s/it] 75%|███████▍  | 46334/61904 [1:26:49<6:04:49,  1.41s/it] 75%|███████▍  | 46335/61904 [1:26:50<5:59:54,  1.39s/it] 75%|███████▍  | 46336/61904 [1:26:52<6:09:39,  1.42s/it] 75%|███████▍  | 46337/61904 [1:26:53<6:03:43,  1.40s/it] 75%|███████▍  | 46338/61904 [1:26:54<5:56:24,  1.37s/it] 75%|███████▍  | 46339/61904 [1:26:56<6:00:46,  1.39s/it] 75%|███████▍  | 46340/61904 [1:26:57<6:04:40,  1.41s/it]                                                         {'loss': 2.4448, 'learning_rate': 1.252236483858421e-07, 'epoch': 11.98}
 75%|███████▍  | 46340/61904 [1:26:57<6:04:40,  1.41s/it] 75%|███████▍  | 46341/61904 [1:26:59<6:04:56,  1.41s/it] 75%|███████▍  | 46342/61904 [1:27:00<6:06:45,  1.41s/it] 75%|███████▍  | 46343/61904 [1:27:01<6:04:54,  1.41s/it] 75%|███████▍  | 46344/61904 [1:27:03<6:08:17,  1.42s/it] 75%|███████▍  | 46345/61904 [1:27:04<6:04:01,  1.40s/it] 75%|███████▍  | 46346/61904 [1:27:05<5:51:24,  1.36s/it] 75%|███████▍  | 46347/61904 [1:27:07<5:44:55,  1.33s/it] 75%|███████▍  | 46348/61904 [1:27:08<5:39:35,  1.31s/it] 75%|███████▍  | 46349/61904 [1:27:10<5:53:33,  1.36s/it] 75%|███████▍  | 46350/61904 [1:27:11<6:00:56,  1.39s/it] 75%|███████▍  | 46351/61904 [1:27:12<6:01:08,  1.39s/it] 75%|███████▍  | 46352/61904 [1:27:14<5:55:00,  1.37s/it] 75%|███████▍  | 46353/61904 [1:27:15<5:44:52,  1.33s/it] 75%|███████▍  | 46354/61904 [1:27:16<5:41:44,  1.32s/it] 75%|███████▍  | 46355/61904 [1:27:18<6:12:32,  1.44s/it] 75%|███████▍  | 46356/61904 [1:27:19<6:02:09,  1.40s/it] 75%|███████▍  | 46357/61904 [1:27:21<6:03:56,  1.40s/it] 75%|███████▍  | 46358/61904 [1:27:22<6:05:21,  1.41s/it] 75%|███████▍  | 46359/61904 [1:27:23<5:57:09,  1.38s/it] 75%|███████▍  | 46360/61904 [1:27:25<6:10:54,  1.43s/it]                                                         {'loss': 2.4594, 'learning_rate': 1.2519123557629975e-07, 'epoch': 11.98}
 75%|███████▍  | 46360/61904 [1:27:25<6:10:54,  1.43s/it] 75%|███████▍  | 46361/61904 [1:27:26<6:06:00,  1.41s/it] 75%|███████▍  | 46362/61904 [1:27:28<6:06:36,  1.42s/it] 75%|███████▍  | 46363/61904 [1:27:29<5:57:22,  1.38s/it] 75%|███████▍  | 46364/61904 [1:27:30<5:58:43,  1.39s/it] 75%|███████▍  | 46365/61904 [1:27:32<5:52:40,  1.36s/it] 75%|███████▍  | 46366/61904 [1:27:33<5:53:12,  1.36s/it] 75%|███████▍  | 46367/61904 [1:27:34<5:52:26,  1.36s/it] 75%|███████▍  | 46368/61904 [1:27:36<5:50:55,  1.36s/it] 75%|███████▍  | 46369/61904 [1:27:37<5:48:28,  1.35s/it] 75%|███████▍  | 46370/61904 [1:27:38<5:49:30,  1.35s/it] 75%|███████▍  | 46371/61904 [1:27:40<5:50:17,  1.35s/it] 75%|███████▍  | 46372/61904 [1:27:41<5:44:42,  1.33s/it] 75%|███████▍  | 46373/61904 [1:27:42<5:45:46,  1.34s/it] 75%|███████▍  | 46374/61904 [1:27:44<6:04:20,  1.41s/it] 75%|███████▍  | 46375/61904 [1:27:45<6:06:13,  1.41s/it] 75%|███████▍  | 46376/61904 [1:27:47<6:05:02,  1.41s/it] 75%|███████▍  | 46377/61904 [1:27:48<5:58:18,  1.38s/it] 75%|███████▍  | 46378/61904 [1:27:50<5:52:45,  1.36s/it] 75%|███████▍  | 46379/61904 [1:27:51<5:50:35,  1.35s/it] 75%|███████▍  | 46380/61904 [1:27:52<5:43:32,  1.33s/it]                                                         {'loss': 2.4473, 'learning_rate': 1.2515882276675742e-07, 'epoch': 11.99}
 75%|███████▍  | 46380/61904 [1:27:52<5:43:32,  1.33s/it] 75%|███████▍  | 46381/61904 [1:27:53<5:47:41,  1.34s/it] 75%|███████▍  | 46382/61904 [1:27:55<5:53:40,  1.37s/it] 75%|███████▍  | 46383/61904 [1:27:56<5:47:39,  1.34s/it] 75%|███████▍  | 46384/61904 [1:27:57<5:44:32,  1.33s/it] 75%|███████▍  | 46385/61904 [1:27:59<5:49:02,  1.35s/it] 75%|███████▍  | 46386/61904 [1:28:00<5:56:06,  1.38s/it] 75%|███████▍  | 46387/61904 [1:28:02<5:52:47,  1.36s/it] 75%|███████▍  | 46388/61904 [1:28:03<5:52:39,  1.36s/it] 75%|███████▍  | 46389/61904 [1:28:05<6:07:40,  1.42s/it] 75%|███████▍  | 46390/61904 [1:28:06<6:04:39,  1.41s/it] 75%|███████▍  | 46391/61904 [1:28:07<5:58:05,  1.38s/it] 75%|███████▍  | 46392/61904 [1:28:09<5:51:59,  1.36s/it] 75%|███████▍  | 46393/61904 [1:28:10<6:01:08,  1.40s/it] 75%|███████▍  | 46394/61904 [1:28:11<5:57:19,  1.38s/it] 75%|███████▍  | 46395/61904 [1:28:13<5:55:42,  1.38s/it] 75%|███████▍  | 46396/61904 [1:28:14<5:51:43,  1.36s/it] 75%|███████▍  | 46397/61904 [1:28:15<5:47:24,  1.34s/it] 75%|███████▍  | 46398/61904 [1:28:17<5:47:48,  1.35s/it] 75%|███████▍  | 46399/61904 [1:28:18<5:58:04,  1.39s/it] 75%|███████▍  | 46400/61904 [1:28:20<5:59:25,  1.39s/it]                                                         {'loss': 2.4831, 'learning_rate': 1.2512640995721508e-07, 'epoch': 11.99}
 75%|███████▍  | 46400/61904 [1:28:20<5:59:25,  1.39s/it] 75%|███████▍  | 46401/61904 [1:28:21<5:45:28,  1.34s/it] 75%|███████▍  | 46402/61904 [1:28:22<5:50:03,  1.35s/it] 75%|███████▍  | 46403/61904 [1:28:24<5:57:16,  1.38s/it] 75%|███████▍  | 46404/61904 [1:28:25<5:53:32,  1.37s/it] 75%|███████▍  | 46405/61904 [1:28:26<5:55:36,  1.38s/it] 75%|███████▍  | 46406/61904 [1:28:28<5:57:37,  1.38s/it] 75%|███████▍  | 46407/61904 [1:28:29<5:53:15,  1.37s/it] 75%|███████▍  | 46408/61904 [1:28:31<5:51:44,  1.36s/it] 75%|███████▍  | 46409/61904 [1:28:32<6:03:10,  1.41s/it] 75%|███████▍  | 46410/61904 [1:28:33<6:00:21,  1.40s/it] 75%|███████▍  | 46411/61904 [1:28:35<5:53:18,  1.37s/it] 75%|███████▍  | 46412/61904 [1:28:36<5:57:28,  1.38s/it] 75%|███████▍  | 46413/61904 [1:28:38<5:57:04,  1.38s/it] 75%|███████▍  | 46414/61904 [1:28:39<5:52:35,  1.37s/it] 75%|███████▍  | 46415/61904 [1:28:40<5:48:58,  1.35s/it] 75%|███████▍  | 46416/61904 [1:28:41<5:45:52,  1.34s/it] 75%|███████▍  | 46417/61904 [1:28:43<5:43:19,  1.33s/it] 75%|███████▍  | 46418/61904 [1:28:44<5:46:09,  1.34s/it] 75%|███████▍  | 46419/61904 [1:28:46<5:54:07,  1.37s/it] 75%|███████▍  | 46420/61904 [1:28:47<5:56:51,  1.38s/it]                                                         {'loss': 2.4706, 'learning_rate': 1.2509399714767277e-07, 'epoch': 12.0}
 75%|███████▍  | 46420/61904 [1:28:47<5:56:51,  1.38s/it] 75%|███████▍  | 46421/61904 [1:28:48<5:50:55,  1.36s/it] 75%|███████▍  | 46422/61904 [1:28:50<5:57:30,  1.39s/it] 75%|███████▍  | 46423/61904 [1:28:51<5:56:53,  1.38s/it] 75%|███████▍  | 46424/61904 [1:28:53<6:08:39,  1.43s/it] 75%|███████▍  | 46425/61904 [1:28:54<5:59:34,  1.39s/it] 75%|███████▍  | 46426/61904 [1:28:55<6:03:16,  1.41s/it] 75%|███████▍  | 46427/61904 [1:28:57<5:56:44,  1.38s/it] 75%|███████▌  | 46428/61904 [1:28:58<6:11:43,  1.44s/it]Generation Kwargs:
{'max_length': 384, 'max_gen_length': 380, 'num_beams': 5}

  0%|          | 0/861 [00:00<?, ?it/s][A
  0%|          | 2/861 [00:01<07:43,  1.85it/s][A
  0%|          | 3/861 [00:03<16:09,  1.13s/it][A
  0%|          | 4/861 [00:05<21:52,  1.53s/it][A
  1%|          | 5/861 [00:06<18:54,  1.32s/it][A
  1%|          | 6/861 [00:07<19:07,  1.34s/it][A
  1%|          | 7/861 [00:07<14:56,  1.05s/it][A
  1%|          | 8/861 [00:09<15:00,  1.06s/it][A
  1%|          | 9/861 [00:09<13:49,  1.03it/s][A
  1%|          | 10/861 [00:10<13:06,  1.08it/s][A
  1%|▏         | 11/861 [00:12<15:18,  1.08s/it][A
  1%|▏         | 12/861 [00:13<16:02,  1.13s/it][A
  2%|▏         | 13/861 [00:14<14:47,  1.05s/it][A
  2%|▏         | 14/861 [00:14<11:34,  1.22it/s][A
  2%|▏         | 15/861 [00:15<10:20,  1.36it/s][A
  2%|▏         | 16/861 [00:15<08:41,  1.62it/s][A
  2%|▏         | 17/861 [00:16<11:26,  1.23it/s][A
  2%|▏         | 18/861 [00:16<08:57,  1.57it/s][A
  2%|▏         | 19/861 [00:18<13:27,  1.04it/s][A
  2%|▏         | 20/861 [00:19<13:58,  1.00it/s][A
  2%|▏         | 21/861 [00:20<12:01,  1.16it/s][A
  3%|▎         | 22/861 [00:21<13:54,  1.01it/s][A
  3%|▎         | 23/861 [00:21<11:00,  1.27it/s][A
  3%|▎         | 24/861 [00:23<13:47,  1.01it/s][A
  3%|▎         | 25/861 [00:24<13:46,  1.01it/s][A
  3%|▎         | 26/861 [00:25<14:30,  1.04s/it][A
  3%|▎         | 27/861 [00:26<15:56,  1.15s/it][A
  3%|▎         | 28/861 [00:29<20:28,  1.48s/it][A
  3%|▎         | 29/861 [00:29<15:32,  1.12s/it][A
  3%|▎         | 30/861 [00:30<17:21,  1.25s/it][A
  4%|▎         | 31/861 [00:31<14:19,  1.04s/it][A
  4%|▎         | 32/861 [00:31<11:33,  1.19it/s][A
  4%|▍         | 33/861 [00:32<12:28,  1.11it/s][A
  4%|▍         | 34/861 [00:33<12:25,  1.11it/s][A
  4%|▍         | 35/861 [00:35<13:43,  1.00it/s][A
  4%|▍         | 36/861 [00:35<13:00,  1.06it/s][A
  4%|▍         | 37/861 [00:36<12:54,  1.06it/s][A
  4%|▍         | 38/861 [00:37<14:07,  1.03s/it][A
  5%|▍         | 39/861 [00:38<12:44,  1.07it/s][A
  5%|▍         | 40/861 [00:39<11:49,  1.16it/s][A
  5%|▍         | 41/861 [00:39<09:38,  1.42it/s][A
  5%|▍         | 42/861 [00:40<11:28,  1.19it/s][A
  5%|▍         | 43/861 [00:41<12:09,  1.12it/s][A
  5%|▌         | 44/861 [00:42<11:45,  1.16it/s][A
  5%|▌         | 45/861 [00:43<11:53,  1.14it/s][A
  5%|▌         | 46/861 [00:45<16:14,  1.20s/it][A
  5%|▌         | 47/861 [00:46<16:25,  1.21s/it][A
  6%|▌         | 48/861 [00:48<18:01,  1.33s/it][A
  6%|▌         | 49/861 [00:49<17:20,  1.28s/it][A
  6%|▌         | 50/861 [00:49<12:50,  1.05it/s][A
  6%|▌         | 51/861 [00:50<12:56,  1.04it/s][A
  6%|▌         | 52/861 [00:51<11:57,  1.13it/s][A
  6%|▌         | 53/861 [00:52<11:11,  1.20it/s][A
  6%|▋         | 54/861 [00:52<08:47,  1.53it/s][A
  6%|▋         | 55/861 [00:52<08:24,  1.60it/s][A
  7%|▋         | 56/861 [00:53<08:32,  1.57it/s][A
  7%|▋         | 57/861 [00:53<07:12,  1.86it/s][A
  7%|▋         | 58/861 [00:54<06:15,  2.14it/s][A
  7%|▋         | 59/861 [00:55<07:41,  1.74it/s][A
  7%|▋         | 60/861 [00:55<08:09,  1.64it/s][A
  7%|▋         | 61/861 [00:56<07:23,  1.81it/s][A
  7%|▋         | 62/861 [00:56<06:41,  1.99it/s][A
  7%|▋         | 63/861 [00:57<06:32,  2.03it/s][A
  7%|▋         | 64/861 [00:57<06:35,  2.01it/s][A
  8%|▊         | 65/861 [00:58<06:32,  2.03it/s][A
  8%|▊         | 66/861 [00:58<06:29,  2.04it/s][A
  8%|▊         | 67/861 [00:59<07:48,  1.70it/s][A
  8%|▊         | 68/861 [01:00<09:25,  1.40it/s][A
  8%|▊         | 69/861 [01:01<10:52,  1.21it/s][A
  8%|▊         | 70/861 [01:02<13:12,  1.00s/it][A
  8%|▊         | 71/861 [01:04<14:36,  1.11s/it][A
  8%|▊         | 72/861 [01:05<13:39,  1.04s/it][A
  8%|▊         | 73/861 [01:05<10:38,  1.23it/s][A
  9%|▊         | 74/861 [01:06<10:09,  1.29it/s][A
  9%|▊         | 75/861 [01:07<11:33,  1.13it/s][A
  9%|▉         | 76/861 [01:07<10:03,  1.30it/s][A
  9%|▉         | 77/861 [01:08<10:54,  1.20it/s][A
  9%|▉         | 78/861 [01:09<10:25,  1.25it/s][A
  9%|▉         | 79/861 [01:10<11:36,  1.12it/s][A
  9%|▉         | 80/861 [01:10<09:58,  1.30it/s][A
  9%|▉         | 81/861 [01:11<10:37,  1.22it/s][A
 10%|▉         | 82/861 [01:12<09:27,  1.37it/s][A
 10%|▉         | 83/861 [01:13<09:41,  1.34it/s][A
 10%|▉         | 84/861 [01:14<11:20,  1.14it/s][A
 10%|▉         | 85/861 [01:14<10:22,  1.25it/s][A
 10%|▉         | 86/861 [01:15<09:07,  1.41it/s][A
 10%|█         | 87/861 [01:16<10:58,  1.17it/s][A
 10%|█         | 88/861 [01:16<08:21,  1.54it/s][A
 10%|█         | 89/861 [01:17<08:14,  1.56it/s][A
 10%|█         | 90/861 [01:19<13:31,  1.05s/it][A
 11%|█         | 91/861 [01:20<11:46,  1.09it/s][A
 11%|█         | 92/861 [01:20<11:34,  1.11it/s][A
 11%|█         | 93/861 [01:22<12:09,  1.05it/s][A
 11%|█         | 94/861 [01:22<09:34,  1.34it/s][A
 11%|█         | 95/861 [01:22<09:03,  1.41it/s][A
 11%|█         | 96/861 [01:23<10:07,  1.26it/s][A
 11%|█▏        | 97/861 [01:25<11:40,  1.09it/s][A
 11%|█▏        | 98/861 [01:25<11:34,  1.10it/s][A
 11%|█▏        | 99/861 [01:27<14:29,  1.14s/it][A
 12%|█▏        | 100/861 [01:28<12:14,  1.04it/s][A
 12%|█▏        | 101/861 [01:28<10:25,  1.21it/s][A
 12%|█▏        | 102/861 [01:29<09:24,  1.34it/s][A
 12%|█▏        | 103/861 [01:29<07:59,  1.58it/s][A
 12%|█▏        | 104/861 [01:31<11:17,  1.12it/s][A
 12%|█▏        | 105/861 [01:32<12:02,  1.05it/s][A
 12%|█▏        | 106/861 [01:32<10:10,  1.24it/s][A
 12%|█▏        | 107/861 [01:33<09:01,  1.39it/s][A
 13%|█▎        | 108/861 [01:33<07:14,  1.73it/s][A
 13%|█▎        | 109/861 [01:33<06:02,  2.07it/s][A
 13%|█▎        | 110/861 [01:34<07:17,  1.72it/s][A
 13%|█▎        | 111/861 [01:35<09:41,  1.29it/s][A
 13%|█▎        | 112/861 [01:36<07:56,  1.57it/s][A
 13%|█▎        | 113/861 [01:36<08:16,  1.51it/s][A
 13%|█▎        | 114/861 [01:37<08:55,  1.40it/s][A
 13%|█▎        | 115/861 [01:38<07:40,  1.62it/s][A
 13%|█▎        | 116/861 [01:38<06:38,  1.87it/s][A
 14%|█▎        | 117/861 [01:39<09:26,  1.31it/s][A
 14%|█▎        | 118/861 [01:40<09:20,  1.33it/s][A
 14%|█▍        | 119/861 [01:41<08:47,  1.41it/s][A
 14%|█▍        | 120/861 [01:41<06:55,  1.79it/s][A
 14%|█▍        | 121/861 [01:42<08:36,  1.43it/s][A
 14%|█▍        | 122/861 [01:43<10:13,  1.20it/s][A
 14%|█▍        | 123/861 [01:44<09:40,  1.27it/s][A
 14%|█▍        | 124/861 [01:45<13:43,  1.12s/it][A
 15%|█▍        | 125/861 [01:46<12:02,  1.02it/s][A
 15%|█▍        | 126/861 [01:47<12:27,  1.02s/it][A
 15%|█▍        | 127/861 [01:48<12:34,  1.03s/it][A
 15%|█▍        | 128/861 [01:49<10:37,  1.15it/s][A
 15%|█▍        | 129/861 [01:50<11:09,  1.09it/s][A
 15%|█▌        | 130/861 [01:51<10:55,  1.12it/s][A
 15%|█▌        | 131/861 [01:51<10:24,  1.17it/s][A
 15%|█▌        | 132/861 [01:53<11:17,  1.08it/s][A
 15%|█▌        | 133/861 [01:53<10:58,  1.11it/s][A
 16%|█▌        | 134/861 [01:54<08:21,  1.45it/s][A
 16%|█▌        | 135/861 [01:54<07:19,  1.65it/s][A
 16%|█▌        | 136/861 [01:54<06:58,  1.73it/s][A
 16%|█▌        | 137/861 [01:55<06:10,  1.96it/s][A
 16%|█▌        | 138/861 [01:55<05:49,  2.07it/s][A
 16%|█▌        | 139/861 [01:56<05:17,  2.27it/s][A
 16%|█▋        | 140/861 [01:56<05:04,  2.37it/s][A
 16%|█▋        | 141/861 [01:56<04:55,  2.44it/s][A
 16%|█▋        | 142/861 [01:57<04:47,  2.50it/s][A
 17%|█▋        | 143/861 [01:58<08:04,  1.48it/s][A
 17%|█▋        | 144/861 [01:59<10:17,  1.16it/s][A
 17%|█▋        | 145/861 [02:00<08:54,  1.34it/s][A
 17%|█▋        | 146/861 [02:01<08:43,  1.37it/s][A
 17%|█▋        | 147/861 [02:01<08:56,  1.33it/s][A
 17%|█▋        | 148/861 [02:02<07:09,  1.66it/s][A
 17%|█▋        | 149/861 [02:02<06:28,  1.83it/s][A
 17%|█▋        | 150/861 [02:04<10:45,  1.10it/s][A
 18%|█▊        | 151/861 [02:05<13:01,  1.10s/it][A
 18%|█▊        | 152/861 [02:06<11:28,  1.03it/s][A
 18%|█▊        | 153/861 [02:07<11:16,  1.05it/s][A
 18%|█▊        | 154/861 [02:07<09:13,  1.28it/s][A
 18%|█▊        | 155/861 [02:09<12:08,  1.03s/it][A
 18%|█▊        | 156/861 [02:10<12:28,  1.06s/it][A
 18%|█▊        | 157/861 [02:11<11:14,  1.04it/s][A
 18%|█▊        | 158/861 [02:12<11:16,  1.04it/s][A
 18%|█▊        | 159/861 [02:12<09:59,  1.17it/s][A
 19%|█▊        | 160/861 [02:13<09:48,  1.19it/s][A
 19%|█▊        | 161/861 [02:15<13:38,  1.17s/it][A
 19%|█▉        | 162/861 [02:15<10:28,  1.11it/s][A
 19%|█▉        | 163/861 [02:16<08:12,  1.42it/s][A
 19%|█▉        | 164/861 [02:17<11:17,  1.03it/s][A
 19%|█▉        | 165/861 [02:18<11:44,  1.01s/it][A
 19%|█▉        | 166/861 [02:19<11:11,  1.04it/s][A
 19%|█▉        | 167/861 [02:19<08:25,  1.37it/s][A
 20%|█▉        | 168/861 [02:20<08:44,  1.32it/s][A
 20%|█▉        | 169/861 [02:21<10:16,  1.12it/s][A
 20%|█▉        | 170/861 [02:22<10:01,  1.15it/s][A
 20%|█▉        | 171/861 [02:23<09:23,  1.22it/s][A
 20%|█▉        | 172/861 [02:23<08:23,  1.37it/s][A
 20%|██        | 173/861 [02:24<08:13,  1.39it/s][A
 20%|██        | 174/861 [02:26<11:25,  1.00it/s][A
 20%|██        | 175/861 [02:26<10:25,  1.10it/s][A
 20%|██        | 176/861 [02:27<07:59,  1.43it/s][A
 21%|██        | 177/861 [02:27<08:29,  1.34it/s][A
 21%|██        | 178/861 [02:28<09:17,  1.22it/s][A
 21%|██        | 179/861 [02:29<08:56,  1.27it/s][A
 21%|██        | 180/861 [02:30<08:28,  1.34it/s][A
 21%|██        | 181/861 [02:30<07:15,  1.56it/s][A
 21%|██        | 182/861 [02:31<06:26,  1.76it/s][A
 21%|██▏       | 183/861 [02:32<07:49,  1.44it/s][A
 21%|██▏       | 184/861 [02:33<09:22,  1.20it/s][A
 21%|██▏       | 185/861 [02:33<08:14,  1.37it/s][A
 22%|██▏       | 186/861 [02:34<07:17,  1.54it/s][A
 22%|██▏       | 187/861 [02:35<08:15,  1.36it/s][A
 22%|██▏       | 188/861 [02:36<09:09,  1.23it/s][A
 22%|██▏       | 189/861 [02:37<11:21,  1.01s/it][A
 22%|██▏       | 190/861 [02:38<11:38,  1.04s/it][A
 22%|██▏       | 191/861 [02:39<09:37,  1.16it/s][A
 22%|██▏       | 192/861 [02:39<09:19,  1.20it/s][A
 22%|██▏       | 193/861 [02:40<09:49,  1.13it/s][A
 23%|██▎       | 194/861 [02:41<08:37,  1.29it/s][A
 23%|██▎       | 195/861 [02:41<07:39,  1.45it/s][A
 23%|██▎       | 196/861 [02:42<07:00,  1.58it/s][A
 23%|██▎       | 197/861 [02:42<06:30,  1.70it/s][A
 23%|██▎       | 198/861 [02:43<05:45,  1.92it/s][A
 23%|██▎       | 199/861 [02:44<06:34,  1.68it/s][A
 23%|██▎       | 200/861 [02:45<08:07,  1.36it/s][A
 23%|██▎       | 201/861 [02:46<09:10,  1.20it/s][A
 23%|██▎       | 202/861 [02:47<09:51,  1.11it/s][A
 24%|██▎       | 203/861 [02:47<07:49,  1.40it/s][A
 24%|██▎       | 204/861 [02:47<06:02,  1.81it/s][A
 24%|██▍       | 205/861 [02:48<05:33,  1.97it/s][A
 24%|██▍       | 206/861 [02:48<06:08,  1.78it/s][A
 24%|██▍       | 207/861 [02:49<06:33,  1.66it/s][A
 24%|██▍       | 208/861 [02:50<06:50,  1.59it/s][A
 24%|██▍       | 209/861 [02:50<06:47,  1.60it/s][A
 24%|██▍       | 210/861 [02:51<07:01,  1.54it/s][A
 25%|██▍       | 211/861 [02:52<09:36,  1.13it/s][A
 25%|██▍       | 212/861 [02:53<09:38,  1.12it/s][A
 25%|██▍       | 213/861 [02:54<08:20,  1.29it/s][A
 25%|██▍       | 214/861 [02:54<07:39,  1.41it/s][A
 25%|██▍       | 215/861 [02:55<08:21,  1.29it/s][A
 25%|██▌       | 216/861 [02:56<07:22,  1.46it/s][A
 25%|██▌       | 217/861 [02:56<05:59,  1.79it/s][A
 25%|██▌       | 218/861 [02:56<05:20,  2.01it/s][A
 25%|██▌       | 219/861 [02:57<06:49,  1.57it/s][A
 26%|██▌       | 220/861 [02:58<07:33,  1.41it/s][A
 26%|██▌       | 221/861 [02:59<06:43,  1.59it/s][A
 26%|██▌       | 222/861 [03:00<08:35,  1.24it/s][A
 26%|██▌       | 223/861 [03:01<09:07,  1.16it/s][A
 26%|██▌       | 224/861 [03:02<08:28,  1.25it/s][A
 26%|██▌       | 225/861 [03:03<10:31,  1.01it/s][A
 26%|██▌       | 226/861 [03:05<12:40,  1.20s/it][A
 26%|██▋       | 227/861 [03:05<11:16,  1.07s/it][A
 26%|██▋       | 228/861 [03:06<11:03,  1.05s/it][A
 27%|██▋       | 229/861 [03:07<09:29,  1.11it/s][A
 27%|██▋       | 230/861 [03:08<09:42,  1.08it/s][A
 27%|██▋       | 231/861 [03:11<15:12,  1.45s/it][A
 27%|██▋       | 232/861 [03:11<11:11,  1.07s/it][A
 27%|██▋       | 233/861 [03:12<10:03,  1.04it/s][A
 27%|██▋       | 234/861 [03:12<08:52,  1.18it/s][A
 27%|██▋       | 235/861 [03:13<09:00,  1.16it/s][A
 27%|██▋       | 236/861 [03:14<08:27,  1.23it/s][A
 28%|██▊       | 237/861 [03:14<08:08,  1.28it/s][A
 28%|██▊       | 238/861 [03:15<06:35,  1.57it/s][A
 28%|██▊       | 239/861 [03:16<08:05,  1.28it/s][A
 28%|██▊       | 240/861 [03:17<08:22,  1.24it/s][A
 28%|██▊       | 241/861 [03:18<09:49,  1.05it/s][A
 28%|██▊       | 242/861 [03:19<08:28,  1.22it/s][A
 28%|██▊       | 243/861 [03:20<09:35,  1.07it/s][A
 28%|██▊       | 244/861 [03:21<09:07,  1.13it/s][A
 28%|██▊       | 245/861 [03:22<10:01,  1.02it/s][A
 29%|██▊       | 246/861 [03:23<09:47,  1.05it/s][A
 29%|██▊       | 247/861 [03:23<07:55,  1.29it/s][A
 29%|██▉       | 248/861 [03:23<06:04,  1.68it/s][A
 29%|██▉       | 249/861 [03:24<05:52,  1.74it/s][A
 29%|██▉       | 250/861 [03:25<07:48,  1.30it/s][A
 29%|██▉       | 251/861 [03:26<08:04,  1.26it/s][A
 29%|██▉       | 252/861 [03:26<07:55,  1.28it/s][A
 29%|██▉       | 253/861 [03:27<07:08,  1.42it/s][A
 30%|██▉       | 254/861 [03:27<05:46,  1.75it/s][A
 30%|██▉       | 255/861 [03:28<06:16,  1.61it/s][A
 30%|██▉       | 256/861 [03:29<08:07,  1.24it/s][A
 30%|██▉       | 257/861 [03:30<08:22,  1.20it/s][A
 30%|██▉       | 258/861 [03:31<08:47,  1.14it/s][A
 30%|███       | 259/861 [03:32<09:38,  1.04it/s][A
 30%|███       | 260/861 [03:33<09:45,  1.03it/s][A
 30%|███       | 261/861 [03:36<13:48,  1.38s/it][A
 30%|███       | 262/861 [03:36<11:29,  1.15s/it][A
 31%|███       | 263/861 [03:36<08:32,  1.17it/s][A
 31%|███       | 264/861 [03:37<07:46,  1.28it/s][A
 31%|███       | 265/861 [03:37<06:48,  1.46it/s][A
 31%|███       | 266/861 [03:38<05:41,  1.74it/s][A
 31%|███       | 267/861 [03:38<05:29,  1.81it/s][A
 31%|███       | 268/861 [03:39<05:56,  1.67it/s][A
 31%|███       | 269/861 [03:40<06:05,  1.62it/s][A
 31%|███▏      | 270/861 [03:40<06:16,  1.57it/s][A
 31%|███▏      | 271/861 [03:41<06:43,  1.46it/s][A
 32%|███▏      | 272/861 [03:42<08:38,  1.13it/s][A
 32%|███▏      | 273/861 [03:43<08:51,  1.11it/s][A
 32%|███▏      | 274/861 [03:45<10:20,  1.06s/it][A
 32%|███▏      | 275/861 [03:45<07:44,  1.26it/s][A
 32%|███▏      | 276/861 [03:46<08:07,  1.20it/s][A
 32%|███▏      | 277/861 [03:47<10:03,  1.03s/it][A
 32%|███▏      | 278/861 [03:49<10:42,  1.10s/it][A
 32%|███▏      | 279/861 [03:50<10:07,  1.04s/it][A
 33%|███▎      | 280/861 [03:51<09:59,  1.03s/it][A
 33%|███▎      | 281/861 [03:52<10:51,  1.12s/it][A
 33%|███▎      | 282/861 [03:53<09:53,  1.03s/it][A
 33%|███▎      | 283/861 [03:53<08:54,  1.08it/s][A
 33%|███▎      | 284/861 [03:54<07:21,  1.31it/s][A
 33%|███▎      | 285/861 [03:54<06:58,  1.38it/s][A
 33%|███▎      | 286/861 [03:56<10:42,  1.12s/it][A
 33%|███▎      | 287/861 [03:58<12:22,  1.29s/it][A
 33%|███▎      | 288/861 [03:59<11:06,  1.16s/it][A
 34%|███▎      | 289/861 [03:59<08:44,  1.09it/s][A
 34%|███▎      | 290/861 [04:00<07:54,  1.20it/s][A
 34%|███▍      | 291/861 [04:01<07:43,  1.23it/s][A
 34%|███▍      | 292/861 [04:02<09:12,  1.03it/s][A
 34%|███▍      | 293/861 [04:03<09:02,  1.05it/s][A
 34%|███▍      | 294/861 [04:04<09:30,  1.01s/it][A
 34%|███▍      | 295/861 [04:04<07:16,  1.30it/s][A
 34%|███▍      | 296/861 [04:05<06:57,  1.35it/s][A
 34%|███▍      | 297/861 [04:06<08:49,  1.06it/s][A
 35%|███▍      | 298/861 [04:08<09:44,  1.04s/it][A
 35%|███▍      | 299/861 [04:10<11:45,  1.26s/it][A
 35%|███▍      | 300/861 [04:10<09:55,  1.06s/it][A
 35%|███▍      | 301/861 [04:13<13:42,  1.47s/it][A
 35%|███▌      | 302/861 [04:13<10:17,  1.11s/it][A
 35%|███▌      | 303/861 [04:14<11:15,  1.21s/it][A
 35%|███▌      | 304/861 [04:15<11:13,  1.21s/it][A
 35%|███▌      | 305/861 [04:17<11:44,  1.27s/it][A
 36%|███▌      | 306/861 [04:18<12:05,  1.31s/it][A
 36%|███▌      | 307/861 [04:20<13:53,  1.50s/it][A
 36%|███▌      | 308/861 [04:20<10:11,  1.11s/it][A
 36%|███▌      | 309/861 [04:21<07:59,  1.15it/s][A
 36%|███▌      | 310/861 [04:21<07:24,  1.24it/s][A
 36%|███▌      | 311/861 [04:23<08:20,  1.10it/s][A
 36%|███▌      | 312/861 [04:24<08:53,  1.03it/s][A
 36%|███▋      | 313/861 [04:25<10:42,  1.17s/it][A
 36%|███▋      | 314/861 [04:26<10:10,  1.12s/it][A
 37%|███▋      | 315/861 [04:27<08:45,  1.04it/s][A
 37%|███▋      | 316/861 [04:28<09:23,  1.03s/it][A
 37%|███▋      | 317/861 [04:28<07:04,  1.28it/s][A
 37%|███▋      | 318/861 [04:29<05:39,  1.60it/s][A
 37%|███▋      | 319/861 [04:30<08:36,  1.05it/s][A
 37%|███▋      | 320/861 [04:31<07:55,  1.14it/s][A
 37%|███▋      | 321/861 [04:32<09:22,  1.04s/it][A
 37%|███▋      | 322/861 [04:34<11:29,  1.28s/it][A
 38%|███▊      | 323/861 [04:35<10:35,  1.18s/it][A
 38%|███▊      | 324/861 [04:37<11:08,  1.24s/it][A
 38%|███▊      | 325/861 [04:38<11:02,  1.24s/it][A
 38%|███▊      | 326/861 [04:38<08:13,  1.08it/s][A
 38%|███▊      | 327/861 [04:39<08:10,  1.09it/s][A
 38%|███▊      | 328/861 [04:40<08:28,  1.05it/s][A
 38%|███▊      | 329/861 [04:41<09:09,  1.03s/it][A
 38%|███▊      | 330/861 [04:42<08:26,  1.05it/s][A
 38%|███▊      | 331/861 [04:45<14:05,  1.59s/it][A
 39%|███▊      | 332/861 [04:46<12:09,  1.38s/it][A
 39%|███▊      | 333/861 [04:48<12:59,  1.48s/it][A
 39%|███▉      | 334/861 [04:49<12:54,  1.47s/it][A
 39%|███▉      | 335/861 [04:50<10:45,  1.23s/it][A
 39%|███▉      | 336/861 [04:51<11:19,  1.30s/it][A
 39%|███▉      | 337/861 [04:52<09:33,  1.09s/it][A
 39%|███▉      | 338/861 [04:53<08:52,  1.02s/it][A
 39%|███▉      | 339/861 [04:54<09:18,  1.07s/it][A
 39%|███▉      | 340/861 [04:54<07:31,  1.15it/s][A
 40%|███▉      | 341/861 [04:54<05:58,  1.45it/s][A
 40%|███▉      | 342/861 [04:55<05:55,  1.46it/s][A
 40%|███▉      | 343/861 [04:56<06:24,  1.35it/s][A
 40%|███▉      | 344/861 [04:56<05:38,  1.53it/s][A
 40%|████      | 345/861 [04:58<06:41,  1.29it/s][A
 40%|████      | 346/861 [04:58<07:08,  1.20it/s][A
 40%|████      | 347/861 [04:59<06:04,  1.41it/s][A
 40%|████      | 348/861 [04:59<05:48,  1.47it/s][A
 41%|████      | 349/861 [05:00<05:55,  1.44it/s][A
 41%|████      | 350/861 [05:01<06:34,  1.29it/s][A
 41%|████      | 351/861 [05:02<06:25,  1.32it/s][A
 41%|████      | 352/861 [05:03<06:36,  1.28it/s][A
 41%|████      | 353/861 [05:03<06:15,  1.35it/s][A
 41%|████      | 354/861 [05:04<05:56,  1.42it/s][A
 41%|████      | 355/861 [05:04<05:11,  1.62it/s][A
 41%|████▏     | 356/861 [05:05<04:40,  1.80it/s][A
 41%|████▏     | 357/861 [05:05<04:00,  2.10it/s][A
 42%|████▏     | 358/861 [05:06<04:40,  1.79it/s][A
 42%|████▏     | 359/861 [05:07<06:44,  1.24it/s][A
 42%|████▏     | 360/861 [05:09<08:07,  1.03it/s][A
 42%|████▏     | 361/861 [05:09<07:45,  1.07it/s][A
 42%|████▏     | 362/861 [05:11<08:08,  1.02it/s][A
 42%|████▏     | 363/861 [05:11<07:19,  1.13it/s][A
 42%|████▏     | 364/861 [05:12<06:42,  1.23it/s][A
 42%|████▏     | 365/861 [05:14<10:05,  1.22s/it][A
 43%|████▎     | 366/861 [05:15<09:09,  1.11s/it][A
 43%|████▎     | 367/861 [05:17<10:32,  1.28s/it][A
 43%|████▎     | 368/861 [05:18<11:32,  1.40s/it][A
 43%|████▎     | 369/861 [05:19<10:04,  1.23s/it][A
 43%|████▎     | 370/861 [05:20<08:44,  1.07s/it][A
 43%|████▎     | 371/861 [05:21<07:57,  1.03it/s][A
 43%|████▎     | 372/861 [05:22<08:21,  1.03s/it][A
 43%|████▎     | 373/861 [05:22<07:23,  1.10it/s][A
 43%|████▎     | 374/861 [05:25<10:58,  1.35s/it][A
 44%|████▎     | 375/861 [05:27<12:34,  1.55s/it][A
 44%|████▎     | 376/861 [05:27<10:27,  1.29s/it][A
 44%|████▍     | 377/861 [05:29<11:35,  1.44s/it][A
 44%|████▍     | 378/861 [05:31<12:37,  1.57s/it][A
 44%|████▍     | 379/861 [05:31<09:14,  1.15s/it][A
 44%|████▍     | 380/861 [05:32<08:33,  1.07s/it][A
 44%|████▍     | 381/861 [05:33<08:01,  1.00s/it][A
 44%|████▍     | 382/861 [05:34<07:06,  1.12it/s][A
 44%|████▍     | 383/861 [05:34<07:07,  1.12it/s][A
 45%|████▍     | 384/861 [05:35<06:51,  1.16it/s][A
 45%|████▍     | 385/861 [05:36<05:37,  1.41it/s][A
 45%|████▍     | 386/861 [05:36<05:49,  1.36it/s][A
 45%|████▍     | 387/861 [05:38<07:40,  1.03it/s][A
 45%|████▌     | 388/861 [05:39<07:02,  1.12it/s][A
 45%|████▌     | 389/861 [05:39<05:57,  1.32it/s][A
 45%|████▌     | 390/861 [05:40<05:28,  1.44it/s][A
 45%|████▌     | 391/861 [05:40<05:50,  1.34it/s][A
 46%|████▌     | 392/861 [05:41<06:14,  1.25it/s][A
 46%|████▌     | 393/861 [05:43<07:34,  1.03it/s][A
 46%|████▌     | 394/861 [05:44<08:22,  1.08s/it][A
 46%|████▌     | 395/861 [05:45<07:11,  1.08it/s][A
 46%|████▌     | 396/861 [05:45<06:00,  1.29it/s][A
 46%|████▌     | 397/861 [05:45<04:38,  1.67it/s][A
 46%|████▌     | 398/861 [05:46<05:10,  1.49it/s][A
 46%|████▋     | 399/861 [05:47<06:08,  1.25it/s][A
 46%|████▋     | 400/861 [05:48<06:47,  1.13it/s][A
 47%|████▋     | 401/861 [05:49<05:43,  1.34it/s][A
 47%|████▋     | 402/861 [05:49<05:39,  1.35it/s][A
 47%|████▋     | 403/861 [05:50<05:37,  1.36it/s][A
 47%|████▋     | 404/861 [05:51<06:18,  1.21it/s][A
 47%|████▋     | 405/861 [05:52<05:18,  1.43it/s][A
 47%|████▋     | 406/861 [05:53<06:34,  1.15it/s][A
 47%|████▋     | 407/861 [05:54<06:51,  1.10it/s][A
 47%|████▋     | 408/861 [05:55<06:16,  1.20it/s][A
 48%|████▊     | 409/861 [05:55<05:32,  1.36it/s][A
 48%|████▊     | 410/861 [05:56<05:31,  1.36it/s][A
 48%|████▊     | 411/861 [05:56<04:38,  1.61it/s][A
 48%|████▊     | 412/861 [05:58<06:33,  1.14it/s][A
 48%|████▊     | 413/861 [05:58<06:10,  1.21it/s][A
 48%|████▊     | 414/861 [05:59<05:26,  1.37it/s][A
 48%|████▊     | 415/861 [05:59<04:42,  1.58it/s][A
 48%|████▊     | 416/861 [06:00<04:37,  1.60it/s][A
 48%|████▊     | 417/861 [06:00<04:35,  1.61it/s][A
 49%|████▊     | 418/861 [06:01<04:26,  1.66it/s][A
 49%|████▊     | 419/861 [06:02<05:10,  1.42it/s][A
 49%|████▉     | 420/861 [06:03<05:03,  1.45it/s][A
 49%|████▉     | 421/861 [06:03<04:41,  1.57it/s][A
 49%|████▉     | 422/861 [06:04<04:05,  1.79it/s][A
 49%|████▉     | 423/861 [06:05<05:02,  1.45it/s][A
 49%|████▉     | 424/861 [06:05<04:43,  1.54it/s][A
 49%|████▉     | 425/861 [06:06<04:54,  1.48it/s][A
 49%|████▉     | 426/861 [06:07<05:38,  1.29it/s][A
 50%|████▉     | 427/861 [06:08<05:51,  1.23it/s][A
 50%|████▉     | 428/861 [06:08<05:44,  1.26it/s][A
 50%|████▉     | 429/861 [06:09<05:36,  1.28it/s][A
 50%|████▉     | 430/861 [06:10<06:07,  1.17it/s][A
 50%|█████     | 431/861 [06:12<07:18,  1.02s/it][A
 50%|█████     | 432/861 [06:13<08:11,  1.15s/it][A
 50%|█████     | 433/861 [06:14<08:24,  1.18s/it][A
 50%|█████     | 434/861 [06:15<06:50,  1.04it/s][A
 51%|█████     | 435/861 [06:15<05:09,  1.38it/s][A
 51%|█████     | 436/861 [06:15<04:11,  1.69it/s][A
 51%|█████     | 437/861 [06:16<04:01,  1.76it/s][A
 51%|█████     | 438/861 [06:16<03:30,  2.01it/s][A
 51%|█████     | 439/861 [06:17<03:48,  1.84it/s][A
 51%|█████     | 440/861 [06:17<03:17,  2.13it/s][A
 51%|█████     | 441/861 [06:17<02:57,  2.37it/s][A
 51%|█████▏    | 442/861 [06:18<03:09,  2.21it/s][A
 51%|█████▏    | 443/861 [06:18<03:18,  2.11it/s][A
 52%|█████▏    | 444/861 [06:19<03:31,  1.97it/s][A
 52%|█████▏    | 445/861 [06:19<03:08,  2.21it/s][A
 52%|█████▏    | 446/861 [06:20<02:59,  2.31it/s][A
 52%|█████▏    | 447/861 [06:21<04:12,  1.64it/s][A
 52%|█████▏    | 448/861 [06:22<05:28,  1.26it/s][A
 52%|█████▏    | 449/861 [06:23<06:19,  1.09it/s][A
 52%|█████▏    | 450/861 [06:24<06:40,  1.03it/s][A
 52%|█████▏    | 451/861 [06:25<05:44,  1.19it/s][A
 52%|█████▏    | 452/861 [06:25<05:19,  1.28it/s][A
 53%|█████▎    | 453/861 [06:26<04:38,  1.46it/s][A
 53%|█████▎    | 454/861 [06:26<04:24,  1.54it/s][A
 53%|█████▎    | 455/861 [06:27<03:48,  1.78it/s][A
 53%|█████▎    | 456/861 [06:27<03:44,  1.81it/s][A
 53%|█████▎    | 457/861 [06:28<03:51,  1.74it/s][A
 53%|█████▎    | 458/861 [06:29<04:22,  1.54it/s][A
 53%|█████▎    | 459/861 [06:29<03:41,  1.81it/s][A
 53%|█████▎    | 460/861 [06:30<03:54,  1.71it/s][A
 54%|█████▎    | 461/861 [06:31<04:40,  1.43it/s][A
 54%|█████▎    | 462/861 [06:31<04:18,  1.54it/s][A
 54%|█████▍    | 463/861 [06:32<04:26,  1.49it/s][A
 54%|█████▍    | 464/861 [06:32<03:54,  1.70it/s][A
 54%|█████▍    | 465/861 [06:33<03:06,  2.12it/s][A
 54%|█████▍    | 466/861 [06:33<03:13,  2.04it/s][A
 54%|█████▍    | 467/861 [06:34<04:28,  1.47it/s][A
 54%|█████▍    | 468/861 [06:35<03:43,  1.76it/s][A
 54%|█████▍    | 469/861 [06:35<03:43,  1.75it/s][A
 55%|█████▍    | 470/861 [06:35<03:07,  2.09it/s][A
 55%|█████▍    | 471/861 [06:36<03:08,  2.07it/s][A
 55%|█████▍    | 472/861 [06:36<03:09,  2.06it/s][A
 55%|█████▍    | 473/861 [06:37<03:16,  1.98it/s][A
 55%|█████▌    | 474/861 [06:37<02:48,  2.29it/s][A
 55%|█████▌    | 475/861 [06:38<03:16,  1.96it/s][A
 55%|█████▌    | 476/861 [06:38<03:00,  2.14it/s][A
 55%|█████▌    | 477/861 [06:39<03:40,  1.74it/s][A
 56%|█████▌    | 478/861 [06:40<03:31,  1.81it/s][A
 56%|█████▌    | 479/861 [06:40<02:54,  2.19it/s][A
 56%|█████▌    | 480/861 [06:40<03:16,  1.94it/s][A
 56%|█████▌    | 481/861 [06:41<02:51,  2.22it/s][A
 56%|█████▌    | 482/861 [06:41<02:34,  2.45it/s][A
 56%|█████▌    | 483/861 [06:41<02:18,  2.74it/s][A
 56%|█████▌    | 484/861 [06:42<02:25,  2.58it/s][A
 56%|█████▋    | 485/861 [06:42<02:12,  2.85it/s][A
 56%|█████▋    | 486/861 [06:42<01:58,  3.16it/s][A
 57%|█████▋    | 487/861 [06:43<02:33,  2.44it/s][A
 57%|█████▋    | 488/861 [06:43<02:13,  2.80it/s][A
 57%|█████▋    | 489/861 [06:44<02:17,  2.71it/s][A
 57%|█████▋    | 490/861 [06:44<02:09,  2.86it/s][A
 57%|█████▋    | 491/861 [06:44<02:15,  2.74it/s][A
 57%|█████▋    | 492/861 [06:45<02:19,  2.64it/s][A
 57%|█████▋    | 493/861 [06:45<02:25,  2.52it/s][A
 57%|█████▋    | 494/861 [06:45<02:10,  2.80it/s][A
 57%|█████▋    | 495/861 [06:46<03:25,  1.78it/s][A
 58%|█████▊    | 496/861 [06:47<03:54,  1.56it/s][A
 58%|█████▊    | 497/861 [06:47<03:09,  1.92it/s][A
 58%|█████▊    | 498/861 [06:48<02:54,  2.08it/s][A
 58%|█████▊    | 499/861 [06:48<02:30,  2.40it/s][A
 58%|█████▊    | 500/861 [06:49<02:44,  2.20it/s][A
 58%|█████▊    | 501/861 [06:49<02:23,  2.52it/s][A
 58%|█████▊    | 502/861 [06:50<02:54,  2.06it/s][A
 58%|█████▊    | 503/861 [06:50<02:47,  2.13it/s][A
 59%|█████▊    | 504/861 [06:51<02:47,  2.14it/s][A
 59%|█████▊    | 505/861 [06:51<02:26,  2.43it/s][A
 59%|█████▉    | 506/861 [06:51<02:11,  2.69it/s][A
 59%|█████▉    | 507/861 [06:51<02:01,  2.92it/s][A
 59%|█████▉    | 508/861 [06:52<02:57,  1.99it/s][A
 59%|█████▉    | 509/861 [06:53<03:52,  1.51it/s][A
 59%|█████▉    | 510/861 [06:54<03:35,  1.63it/s][A
 59%|█████▉    | 511/861 [06:54<03:30,  1.66it/s][A
 59%|█████▉    | 512/861 [06:55<03:20,  1.74it/s][A
 60%|█████▉    | 513/861 [06:55<03:26,  1.68it/s][A
 60%|█████▉    | 514/861 [06:56<03:12,  1.80it/s][A
 60%|█████▉    | 515/861 [06:56<02:32,  2.27it/s][A
 60%|█████▉    | 516/861 [06:56<02:07,  2.70it/s][A
 60%|██████    | 517/861 [06:57<01:55,  2.97it/s][A
 60%|██████    | 518/861 [06:57<02:12,  2.59it/s][A
 60%|██████    | 519/861 [06:58<02:49,  2.02it/s][A
 60%|██████    | 520/861 [06:58<03:02,  1.87it/s][A
 61%|██████    | 521/861 [06:59<02:35,  2.19it/s][A
 61%|██████    | 522/861 [06:59<02:51,  1.98it/s][A
 61%|██████    | 523/861 [07:00<03:36,  1.56it/s][A
 61%|██████    | 524/861 [07:02<04:33,  1.23it/s][A
 61%|██████    | 525/861 [07:02<03:56,  1.42it/s][A
 61%|██████    | 526/861 [07:03<03:55,  1.42it/s][A
 61%|██████    | 527/861 [07:03<03:51,  1.44it/s][A
 61%|██████▏   | 528/861 [07:04<04:27,  1.25it/s][A
 61%|██████▏   | 529/861 [07:05<03:39,  1.51it/s][A
 62%|██████▏   | 530/861 [07:05<03:09,  1.75it/s][A
 62%|██████▏   | 531/861 [07:06<02:59,  1.84it/s][A
 62%|██████▏   | 532/861 [07:06<03:11,  1.72it/s][A
 62%|██████▏   | 533/861 [07:07<02:55,  1.87it/s][A
 62%|██████▏   | 534/861 [07:07<03:00,  1.81it/s][A
 62%|██████▏   | 535/861 [07:08<02:57,  1.84it/s][A
 62%|██████▏   | 536/861 [07:08<03:02,  1.78it/s][A
 62%|██████▏   | 537/861 [07:10<04:40,  1.16it/s][A
 62%|██████▏   | 538/861 [07:10<03:53,  1.38it/s][A
 63%|██████▎   | 539/861 [07:12<06:01,  1.12s/it][A
 63%|██████▎   | 540/861 [07:13<05:35,  1.04s/it][A
 63%|██████▎   | 541/861 [07:14<04:38,  1.15it/s][A
 63%|██████▎   | 542/861 [07:14<03:38,  1.46it/s][A
 63%|██████▎   | 543/861 [07:15<03:36,  1.47it/s][A
 63%|██████▎   | 544/861 [07:15<03:20,  1.58it/s][A
 63%|██████▎   | 545/861 [07:17<04:26,  1.19it/s][A
 63%|██████▎   | 546/861 [07:18<04:47,  1.10it/s][A
 64%|██████▎   | 547/861 [07:18<04:25,  1.18it/s][A
 64%|██████▎   | 548/861 [07:20<05:09,  1.01it/s][A
 64%|██████▍   | 549/861 [07:21<05:18,  1.02s/it][A
 64%|██████▍   | 550/861 [07:22<04:57,  1.05it/s][A
 64%|██████▍   | 551/861 [07:22<04:34,  1.13it/s][A
 64%|██████▍   | 552/861 [07:23<04:23,  1.17it/s][A
 64%|██████▍   | 553/861 [07:24<04:55,  1.04it/s][A
 64%|██████▍   | 554/861 [07:26<05:29,  1.07s/it][A
 64%|██████▍   | 555/861 [07:27<06:19,  1.24s/it][A
 65%|██████▍   | 556/861 [07:28<06:18,  1.24s/it][A
 65%|██████▍   | 557/861 [07:30<06:50,  1.35s/it][A
 65%|██████▍   | 558/861 [07:31<05:53,  1.17s/it][A
 65%|██████▍   | 559/861 [07:32<06:30,  1.29s/it][A
 65%|██████▌   | 560/861 [07:34<06:17,  1.26s/it][A
 65%|██████▌   | 561/861 [07:35<05:59,  1.20s/it][A
 65%|██████▌   | 562/861 [07:35<05:23,  1.08s/it][A
 65%|██████▌   | 563/861 [07:36<04:52,  1.02it/s][A
 66%|██████▌   | 564/861 [07:37<04:46,  1.04it/s][A
 66%|██████▌   | 565/861 [07:38<04:30,  1.09it/s][A
 66%|██████▌   | 566/861 [07:39<05:13,  1.06s/it][A
 66%|██████▌   | 567/861 [07:41<05:33,  1.14s/it][A
 66%|██████▌   | 568/861 [07:42<05:45,  1.18s/it][A
 66%|██████▌   | 569/861 [07:43<05:15,  1.08s/it][A
 66%|██████▌   | 570/861 [07:44<05:30,  1.14s/it][A
 66%|██████▋   | 571/861 [07:45<05:40,  1.17s/it][A
 66%|██████▋   | 572/861 [07:46<05:42,  1.19s/it][A
 67%|██████▋   | 573/861 [07:47<04:55,  1.03s/it][A
 67%|██████▋   | 574/861 [07:49<05:39,  1.18s/it][A
 67%|██████▋   | 575/861 [07:50<05:16,  1.11s/it][A
 67%|██████▋   | 576/861 [07:52<06:23,  1.34s/it][A
 67%|██████▋   | 577/861 [07:53<06:57,  1.47s/it][A
 67%|██████▋   | 578/861 [07:55<06:58,  1.48s/it][A
 67%|██████▋   | 579/861 [07:57<07:37,  1.62s/it][A
 67%|██████▋   | 580/861 [07:58<06:56,  1.48s/it][A
 67%|██████▋   | 581/861 [07:59<06:18,  1.35s/it][A
 68%|██████▊   | 582/861 [08:01<07:14,  1.56s/it][A
 68%|██████▊   | 583/861 [08:02<06:38,  1.43s/it][A
 68%|██████▊   | 584/861 [08:03<06:02,  1.31s/it][A
 68%|██████▊   | 585/861 [08:04<05:15,  1.14s/it][A
 68%|██████▊   | 586/861 [08:04<04:28,  1.02it/s][A
 68%|██████▊   | 587/861 [08:06<04:37,  1.01s/it][A
 68%|██████▊   | 588/861 [08:07<04:31,  1.01it/s][A
 68%|██████▊   | 589/861 [08:07<04:11,  1.08it/s][A
 69%|██████▊   | 590/861 [08:09<04:59,  1.11s/it][A
 69%|██████▊   | 591/861 [08:09<04:14,  1.06it/s][A
 69%|██████▉   | 592/861 [08:11<04:36,  1.03s/it][A
 69%|██████▉   | 593/861 [08:12<05:35,  1.25s/it][A
 69%|██████▉   | 594/861 [08:14<05:49,  1.31s/it][A
 69%|██████▉   | 595/861 [08:14<04:54,  1.11s/it][A
 69%|██████▉   | 596/861 [08:15<04:00,  1.10it/s][A
 69%|██████▉   | 597/861 [08:15<03:30,  1.26it/s][A
 69%|██████▉   | 598/861 [08:16<03:40,  1.19it/s][A
 70%|██████▉   | 599/861 [08:17<03:43,  1.17it/s][A
 70%|██████▉   | 600/861 [08:18<03:28,  1.25it/s][A
 70%|██████▉   | 601/861 [08:19<03:21,  1.29it/s][A
 70%|██████▉   | 602/861 [08:20<04:43,  1.10s/it][A
 70%|███████   | 603/861 [08:22<05:10,  1.20s/it][A
 70%|███████   | 604/861 [08:23<04:44,  1.11s/it][A
 70%|███████   | 605/861 [08:23<04:04,  1.05it/s][A
 70%|███████   | 606/861 [08:24<04:01,  1.06it/s][A
 70%|███████   | 607/861 [08:25<03:43,  1.14it/s][A
 71%|███████   | 608/861 [08:26<03:21,  1.25it/s][A
 71%|███████   | 609/861 [08:27<03:30,  1.20it/s][A
 71%|███████   | 610/861 [08:28<04:27,  1.07s/it][A
 71%|███████   | 611/861 [08:29<04:35,  1.10s/it][A
 71%|███████   | 612/861 [08:31<04:37,  1.11s/it][A
 71%|███████   | 613/861 [08:31<03:46,  1.10it/s][A
 71%|███████▏  | 614/861 [08:32<04:05,  1.00it/s][A
 71%|███████▏  | 615/861 [08:33<04:12,  1.02s/it][A
 72%|███████▏  | 616/861 [08:35<05:38,  1.38s/it][A
 72%|███████▏  | 617/861 [08:37<05:40,  1.39s/it][A
 72%|███████▏  | 618/861 [08:38<05:28,  1.35s/it][A
 72%|███████▏  | 619/861 [08:39<05:08,  1.27s/it][A
 72%|███████▏  | 620/861 [08:41<05:22,  1.34s/it][A
 72%|███████▏  | 621/861 [08:42<05:11,  1.30s/it][A
 72%|███████▏  | 622/861 [08:42<04:12,  1.05s/it][A
 72%|███████▏  | 623/861 [08:44<05:07,  1.29s/it][A
 72%|███████▏  | 624/861 [08:45<04:18,  1.09s/it][A
 73%|███████▎  | 625/861 [08:45<03:40,  1.07it/s][A
 73%|███████▎  | 626/861 [08:46<03:32,  1.11it/s][A
 73%|███████▎  | 627/861 [08:47<03:23,  1.15it/s][A
 73%|███████▎  | 628/861 [08:48<03:42,  1.05it/s][A
 73%|███████▎  | 629/861 [08:49<03:54,  1.01s/it][A
 73%|███████▎  | 630/861 [08:50<03:26,  1.12it/s][A
 73%|███████▎  | 631/861 [08:50<02:47,  1.37it/s][A
 73%|███████▎  | 632/861 [08:52<03:58,  1.04s/it][A
 74%|███████▎  | 633/861 [08:53<03:28,  1.09it/s][A
 74%|███████▎  | 634/861 [08:55<04:34,  1.21s/it][A
 74%|███████▍  | 635/861 [08:56<04:32,  1.21s/it][A
 74%|███████▍  | 636/861 [08:56<03:54,  1.04s/it][A
 74%|███████▍  | 637/861 [08:57<03:39,  1.02it/s][A
 74%|███████▍  | 638/861 [08:58<03:35,  1.04it/s][A
 74%|███████▍  | 639/861 [09:00<04:03,  1.10s/it][A
 74%|███████▍  | 640/861 [09:00<03:39,  1.01it/s][A
 74%|███████▍  | 641/861 [09:01<03:24,  1.08it/s][A
 75%|███████▍  | 642/861 [09:02<03:43,  1.02s/it][A
 75%|███████▍  | 643/861 [09:03<03:21,  1.08it/s][A
 75%|███████▍  | 644/861 [09:04<03:17,  1.10it/s][A
 75%|███████▍  | 645/861 [09:04<02:43,  1.32it/s][A
 75%|███████▌  | 646/861 [09:05<02:33,  1.40it/s][A
 75%|███████▌  | 647/861 [09:06<02:25,  1.47it/s][A
 75%|███████▌  | 648/861 [09:07<02:44,  1.29it/s][A
 75%|███████▌  | 649/861 [09:07<02:34,  1.37it/s][A
 75%|███████▌  | 650/861 [09:08<02:13,  1.58it/s][A
 76%|███████▌  | 651/861 [09:08<01:55,  1.81it/s][A
 76%|███████▌  | 652/861 [09:09<02:19,  1.50it/s][A
 76%|███████▌  | 653/861 [09:09<02:05,  1.66it/s][A
 76%|███████▌  | 654/861 [09:10<02:10,  1.59it/s][A
 76%|███████▌  | 655/861 [09:10<01:51,  1.85it/s][A
 76%|███████▌  | 656/861 [09:11<01:40,  2.04it/s][A
 76%|███████▋  | 657/861 [09:11<01:39,  2.05it/s][A
 76%|███████▋  | 658/861 [09:12<02:16,  1.48it/s][A
 77%|███████▋  | 659/861 [09:13<02:10,  1.54it/s][A
 77%|███████▋  | 660/861 [09:14<02:26,  1.38it/s][A
 77%|███████▋  | 661/861 [09:14<02:05,  1.59it/s][A
 77%|███████▋  | 662/861 [09:15<02:29,  1.33it/s][A
 77%|███████▋  | 663/861 [09:17<03:37,  1.10s/it][A
 77%|███████▋  | 664/861 [09:18<03:02,  1.08it/s][A
 77%|███████▋  | 665/861 [09:18<02:29,  1.31it/s][A
 77%|███████▋  | 666/861 [09:18<02:03,  1.58it/s][A
 77%|███████▋  | 667/861 [09:19<02:15,  1.43it/s][A
 78%|███████▊  | 668/861 [09:20<02:04,  1.55it/s][A
 78%|███████▊  | 669/861 [09:20<01:47,  1.79it/s][A
 78%|███████▊  | 670/861 [09:21<01:55,  1.65it/s][A
 78%|███████▊  | 671/861 [09:21<01:35,  1.98it/s][A
 78%|███████▊  | 672/861 [09:23<02:33,  1.23it/s][A
 78%|███████▊  | 673/861 [09:23<02:20,  1.34it/s][A
 78%|███████▊  | 674/861 [09:24<01:52,  1.66it/s][A
 78%|███████▊  | 675/861 [09:25<02:15,  1.37it/s][A
 79%|███████▊  | 676/861 [09:25<02:04,  1.49it/s][A
 79%|███████▊  | 677/861 [09:26<01:50,  1.67it/s][A
 79%|███████▊  | 678/861 [09:26<01:42,  1.79it/s][A
 79%|███████▉  | 679/861 [09:26<01:27,  2.07it/s][A
 79%|███████▉  | 680/861 [09:27<01:14,  2.41it/s][A
 79%|███████▉  | 681/861 [09:27<01:12,  2.50it/s][A
 79%|███████▉  | 682/861 [09:28<01:38,  1.82it/s][A
 79%|███████▉  | 683/861 [09:28<01:33,  1.90it/s][A
 79%|███████▉  | 684/861 [09:29<01:47,  1.65it/s][A
 80%|███████▉  | 685/861 [09:30<01:47,  1.64it/s][A
 80%|███████▉  | 686/861 [09:30<01:39,  1.76it/s][A
 80%|███████▉  | 687/861 [09:32<02:45,  1.05it/s][A
 80%|███████▉  | 688/861 [09:32<02:12,  1.30it/s][A
 80%|████████  | 689/861 [09:33<02:10,  1.32it/s][A
 80%|████████  | 690/861 [09:34<02:02,  1.39it/s][A
 80%|████████  | 691/861 [09:35<02:05,  1.35it/s][A
 80%|████████  | 692/861 [09:35<01:47,  1.57it/s][A
 80%|████████  | 693/861 [09:36<01:55,  1.45it/s][A
 81%|████████  | 694/861 [09:36<01:37,  1.72it/s][A
 81%|████████  | 695/861 [09:37<01:33,  1.77it/s][A
 81%|████████  | 696/861 [09:37<01:17,  2.12it/s][A
 81%|████████  | 697/861 [09:37<01:21,  2.00it/s][A
 81%|████████  | 698/861 [09:38<01:36,  1.70it/s][A
 81%|████████  | 699/861 [09:39<01:43,  1.56it/s][A
 81%|████████▏ | 700/861 [09:40<01:49,  1.47it/s][A
 81%|████████▏ | 701/861 [09:41<01:58,  1.35it/s][A
 82%|████████▏ | 702/861 [09:41<01:46,  1.49it/s][A
 82%|████████▏ | 703/861 [09:42<01:33,  1.69it/s][A
 82%|████████▏ | 704/861 [09:42<01:33,  1.68it/s][A
 82%|████████▏ | 705/861 [09:43<01:31,  1.71it/s][A
 82%|████████▏ | 706/861 [09:43<01:24,  1.84it/s][A
 82%|████████▏ | 707/861 [09:44<01:15,  2.03it/s][A
 82%|████████▏ | 708/861 [09:44<01:13,  2.08it/s][A
 82%|████████▏ | 709/861 [09:44<01:08,  2.23it/s][A
 82%|████████▏ | 710/861 [09:46<01:42,  1.47it/s][A
 83%|████████▎ | 711/861 [09:46<01:40,  1.50it/s][A
 83%|████████▎ | 712/861 [09:47<01:27,  1.71it/s][A
 83%|████████▎ | 713/861 [09:47<01:13,  2.01it/s][A
 83%|████████▎ | 714/861 [09:48<01:21,  1.81it/s][A
 83%|████████▎ | 715/861 [09:49<01:39,  1.46it/s][A
 83%|████████▎ | 716/861 [09:49<01:50,  1.31it/s][A
 83%|████████▎ | 717/861 [09:50<01:42,  1.40it/s][A
 83%|████████▎ | 718/861 [09:51<02:01,  1.17it/s][A
 84%|████████▎ | 719/861 [09:52<01:49,  1.30it/s][A
 84%|████████▎ | 720/861 [09:52<01:39,  1.42it/s][A
 84%|████████▎ | 721/861 [09:53<01:32,  1.51it/s][A
 84%|████████▍ | 722/861 [09:54<01:31,  1.52it/s][A
 84%|████████▍ | 723/861 [09:54<01:19,  1.73it/s][A
 84%|████████▍ | 724/861 [09:55<01:17,  1.77it/s][A
 84%|████████▍ | 725/861 [09:55<01:16,  1.78it/s][A
 84%|████████▍ | 726/861 [09:56<01:28,  1.52it/s][A
 84%|████████▍ | 727/861 [09:58<02:12,  1.01it/s][A
 85%|████████▍ | 728/861 [09:59<02:07,  1.05it/s][A
 85%|████████▍ | 729/861 [09:59<01:48,  1.22it/s][A
 85%|████████▍ | 730/861 [09:59<01:28,  1.48it/s][A
 85%|████████▍ | 731/861 [10:00<01:30,  1.44it/s][A
 85%|████████▌ | 732/861 [10:01<01:21,  1.58it/s][A
 85%|████████▌ | 733/861 [10:01<01:21,  1.57it/s][A
 85%|████████▌ | 734/861 [10:02<01:06,  1.91it/s][A
 85%|████████▌ | 735/861 [10:02<01:03,  1.98it/s][A
 85%|████████▌ | 736/861 [10:03<01:07,  1.85it/s][A
 86%|████████▌ | 737/861 [10:03<01:09,  1.79it/s][A
 86%|████████▌ | 738/861 [10:04<01:05,  1.87it/s][A
 86%|████████▌ | 739/861 [10:04<00:59,  2.04it/s][A
 86%|████████▌ | 740/861 [10:05<01:03,  1.91it/s][A
 86%|████████▌ | 741/861 [10:05<01:02,  1.91it/s][A
 86%|████████▌ | 742/861 [10:06<01:15,  1.58it/s][A
 86%|████████▋ | 743/861 [10:07<01:15,  1.55it/s][A
 86%|████████▋ | 744/861 [10:07<01:07,  1.74it/s][A
 87%|████████▋ | 745/861 [10:08<01:13,  1.57it/s][A
 87%|████████▋ | 746/861 [10:08<00:58,  1.95it/s][A
 87%|████████▋ | 747/861 [10:09<01:05,  1.73it/s][A
 87%|████████▋ | 748/861 [10:09<01:03,  1.78it/s][A
 87%|████████▋ | 749/861 [10:10<01:16,  1.47it/s][A
 87%|████████▋ | 750/861 [10:11<01:00,  1.84it/s][A
 87%|████████▋ | 751/861 [10:11<00:49,  2.22it/s][A
 87%|████████▋ | 752/861 [10:12<01:11,  1.53it/s][A
 87%|████████▋ | 753/861 [10:13<01:08,  1.57it/s][A
 88%|████████▊ | 754/861 [10:13<01:00,  1.76it/s][A
 88%|████████▊ | 755/861 [10:14<00:56,  1.86it/s][A
 88%|████████▊ | 756/861 [10:14<00:51,  2.02it/s][A
 88%|████████▊ | 757/861 [10:15<01:09,  1.49it/s][A
 88%|████████▊ | 758/861 [10:16<01:10,  1.46it/s][A
 88%|████████▊ | 759/861 [10:16<01:03,  1.60it/s][A
 88%|████████▊ | 760/861 [10:17<01:13,  1.37it/s][A
 88%|████████▊ | 761/861 [10:19<01:35,  1.05it/s][A
 89%|████████▊ | 762/861 [10:19<01:17,  1.27it/s][A
 89%|████████▊ | 763/861 [10:20<01:08,  1.43it/s][A
 89%|████████▊ | 764/861 [10:20<01:12,  1.35it/s][A
 89%|████████▉ | 765/861 [10:21<01:10,  1.36it/s][A
 89%|████████▉ | 766/861 [10:22<01:09,  1.36it/s][A
 89%|████████▉ | 767/861 [10:25<02:14,  1.43s/it][A
 89%|████████▉ | 768/861 [10:26<01:57,  1.26s/it][A
 89%|████████▉ | 769/861 [10:27<01:49,  1.19s/it][A
 89%|████████▉ | 770/861 [10:27<01:25,  1.06it/s][A
 90%|████████▉ | 771/861 [10:28<01:11,  1.26it/s][A
 90%|████████▉ | 772/861 [10:28<01:06,  1.35it/s][A
 90%|████████▉ | 773/861 [10:30<01:46,  1.21s/it][A
 90%|████████▉ | 774/861 [10:31<01:35,  1.09s/it][A
 90%|█████████ | 775/861 [10:32<01:26,  1.01s/it][A
 90%|█████████ | 776/861 [10:33<01:22,  1.03it/s][A
 90%|█████████ | 777/861 [10:34<01:19,  1.06it/s][A
 90%|█████████ | 778/861 [10:35<01:16,  1.08it/s][A
 90%|█████████ | 779/861 [10:36<01:24,  1.03s/it][A
 91%|█████████ | 780/861 [10:38<01:45,  1.30s/it][A
 91%|█████████ | 781/861 [10:40<02:03,  1.54s/it][A
 91%|█████████ | 782/861 [10:42<02:02,  1.55s/it][A
 91%|█████████ | 783/861 [10:42<01:40,  1.29s/it][A
 91%|█████████ | 784/861 [10:43<01:27,  1.14s/it][A
 91%|█████████ | 785/861 [10:44<01:18,  1.04s/it][A
 91%|█████████▏| 786/861 [10:45<01:11,  1.05it/s][A
 91%|█████████▏| 787/861 [10:45<01:00,  1.21it/s][A
 92%|█████████▏| 788/861 [10:46<00:56,  1.29it/s][A
 92%|█████████▏| 789/861 [10:47<00:56,  1.27it/s][A
 92%|█████████▏| 790/861 [10:47<00:55,  1.28it/s][A
 92%|█████████▏| 791/861 [10:48<00:49,  1.42it/s][A
 92%|█████████▏| 792/861 [10:49<00:47,  1.46it/s][A
 92%|█████████▏| 793/861 [10:49<00:47,  1.42it/s][A
 92%|█████████▏| 794/861 [10:50<00:42,  1.56it/s][A
 92%|█████████▏| 795/861 [10:50<00:40,  1.61it/s][A
 92%|█████████▏| 796/861 [10:51<00:34,  1.89it/s][A
 93%|█████████▎| 797/861 [10:52<00:39,  1.62it/s][A
 93%|█████████▎| 798/861 [10:52<00:34,  1.84it/s][A
 93%|█████████▎| 799/861 [10:52<00:31,  1.94it/s][A
 93%|█████████▎| 800/861 [10:53<00:34,  1.79it/s][A
 93%|█████████▎| 801/861 [10:54<00:48,  1.24it/s][A
 93%|█████████▎| 802/861 [10:55<00:41,  1.42it/s][A
 93%|█████████▎| 803/861 [10:56<00:48,  1.19it/s][A
 93%|█████████▎| 804/861 [10:58<01:07,  1.18s/it][A
 93%|█████████▎| 805/861 [10:59<01:06,  1.18s/it][A
 94%|█████████▎| 806/861 [11:00<00:52,  1.06it/s][A
 94%|█████████▎| 807/861 [11:01<00:55,  1.02s/it][A
 94%|█████████▍| 808/861 [11:02<01:01,  1.17s/it][A
 94%|█████████▍| 809/861 [11:03<00:47,  1.09it/s][A
 94%|█████████▍| 810/861 [11:03<00:41,  1.22it/s][A
 94%|█████████▍| 811/861 [11:04<00:37,  1.34it/s][A
 94%|█████████▍| 812/861 [11:04<00:34,  1.44it/s][A
 94%|█████████▍| 813/861 [11:06<00:41,  1.15it/s][A
 95%|█████████▍| 814/861 [11:07<00:46,  1.01it/s][A
 95%|█████████▍| 815/861 [11:08<00:45,  1.01it/s][A
 95%|█████████▍| 816/861 [11:09<00:39,  1.14it/s][A
 95%|█████████▍| 817/861 [11:09<00:38,  1.14it/s][A
 95%|█████████▌| 818/861 [11:10<00:40,  1.07it/s][A
 95%|█████████▌| 819/861 [11:11<00:34,  1.21it/s][A
 95%|█████████▌| 820/861 [11:12<00:36,  1.12it/s][A
 95%|█████████▌| 821/861 [11:13<00:33,  1.18it/s][A
 95%|█████████▌| 822/861 [11:14<00:40,  1.05s/it][A
 96%|█████████▌| 823/861 [11:16<00:48,  1.27s/it][A
 96%|█████████▌| 824/861 [11:17<00:37,  1.02s/it][A
 96%|█████████▌| 825/861 [11:17<00:31,  1.14it/s][A
 96%|█████████▌| 826/861 [11:19<00:38,  1.11s/it][A
 96%|█████████▌| 827/861 [11:20<00:38,  1.13s/it][A
 96%|█████████▌| 828/861 [11:20<00:29,  1.13it/s][A
 96%|█████████▋| 829/861 [11:22<00:32,  1.02s/it][A
 96%|█████████▋| 830/861 [11:23<00:30,  1.00it/s][A
 97%|█████████▋| 831/861 [11:24<00:36,  1.21s/it][A
 97%|█████████▋| 832/861 [11:25<00:29,  1.02s/it][A
 97%|█████████▋| 833/861 [11:25<00:24,  1.14it/s][A
 97%|█████████▋| 834/861 [11:27<00:25,  1.06it/s][A
 97%|█████████▋| 835/861 [11:27<00:24,  1.07it/s][A
 97%|█████████▋| 836/861 [11:28<00:23,  1.06it/s][A
 97%|█████████▋| 837/861 [11:30<00:24,  1.03s/it][A
 97%|█████████▋| 838/861 [11:31<00:25,  1.10s/it][A
 97%|█████████▋| 839/861 [11:32<00:21,  1.03it/s][A
 98%|█████████▊| 840/861 [11:32<00:17,  1.18it/s][A
 98%|█████████▊| 841/861 [11:33<00:16,  1.25it/s][A
 98%|█████████▊| 842/861 [11:33<00:13,  1.38it/s][A
 98%|█████████▊| 843/861 [11:34<00:12,  1.41it/s][A
 98%|█████████▊| 844/861 [11:35<00:11,  1.46it/s][A
 98%|█████████▊| 845/861 [11:36<00:13,  1.19it/s][A
 98%|█████████▊| 846/861 [11:36<00:10,  1.38it/s][A
 98%|█████████▊| 847/861 [11:37<00:10,  1.29it/s][A
 98%|█████████▊| 848/861 [11:38<00:10,  1.29it/s][A
 99%|█████████▊| 849/861 [11:39<00:10,  1.14it/s][A
 99%|█████████▊| 850/861 [11:40<00:08,  1.27it/s][A
 99%|█████████▉| 851/861 [11:40<00:07,  1.41it/s][A
 99%|█████████▉| 852/861 [11:41<00:05,  1.52it/s][A
 99%|█████████▉| 853/861 [11:41<00:05,  1.54it/s][A
 99%|█████████▉| 854/861 [11:42<00:04,  1.59it/s][A
 99%|█████████▉| 855/861 [11:43<00:04,  1.35it/s][A
 99%|█████████▉| 856/861 [11:44<00:04,  1.06it/s][A
100%|█████████▉| 857/861 [11:45<00:03,  1.05it/s][A
100%|█████████▉| 858/861 [11:46<00:02,  1.05it/s][A
100%|█████████▉| 859/861 [11:47<00:01,  1.12it/s][A
100%|█████████▉| 860/861 [11:48<00:00,  1.07it/s][A
100%|██████████| 861/861 [11:49<00:00,  1.05it/s][A{'score': 12.509961638161249, 'counts': [18011, 8302, 4221, 2162], 'totals': [51205, 49483, 47761, 46039], 'precisions': [35.1742993848257, 16.777479134248125, 8.83775465337828, 4.696018592932079], 'bp': 1.0, 'sys_len': 51205, 'ref_len': 32555}
                                                         
                                                 [A{'eval_loss': 2.4478776454925537, 'eval_bleu': 12.51, 'eval_gen_len': 37.4146, 'eval_runtime': 807.7318, 'eval_samples_per_second': 2.132, 'eval_steps_per_second': 1.066, 'epoch': 12.0}
 75%|███████▌  | 46428/61904 [1:42:27<6:11:43,  1.44s/it]
100%|██████████| 861/861 [13:26<00:00,  1.05it/s][A
                                                 [A[WARNING|configuration_utils.py:448] 2024-10-28 17:08:07,139 >> Some non-default generation parameters are set in the model config. These should go into a GenerationConfig file (https://huggingface.co/docs/transformers/generation_strategies#save-a-custom-decoding-strategy-with-your-model) instead. This warning will be raised to an exception in v4.41.
Non-default generation parameters: {'max_length': 200, 'early_stopping': True, 'num_beams': 5, 'forced_eos_token_id': 2}
/opt/conda/lib/python3.10/multiprocessing/popen_fork.py:66: RuntimeWarning: os.fork() was called. os.fork() is incompatible with multithreaded code, and JAX is multithreaded, so this will likely lead to a deadlock.
  self.pid = os.fork()
 75%|███████▌  | 46429/61904 [1:42:46<1071:42:26, 249.31s/it] 75%|███████▌  | 46430/61904 [1:42:48<752:13:49, 175.01s/it]  75%|███████▌  | 46431/61904 [1:42:49<528:27:03, 122.95s/it] 75%|███████▌  | 46432/61904 [1:42:51<371:51:40, 86.52s/it]  75%|███████▌  | 46433/61904 [1:42:52<262:06:56, 60.99s/it] 75%|███████▌  | 46434/61904 [1:42:53<185:19:45, 43.13s/it] 75%|███████▌  | 46435/61904 [1:42:55<131:31:54, 30.61s/it] 75%|███████▌  | 46436/61904 [1:42:56<93:45:21, 21.82s/it]  75%|███████▌  | 46437/61904 [1:42:58<67:32:22, 15.72s/it] 75%|███████▌  | 46438/61904 [1:42:59<49:09:39, 11.44s/it] 75%|███████▌  | 46439/61904 [1:43:01<36:13:35,  8.43s/it] 75%|███████▌  | 46440/61904 [1:43:02<27:10:21,  6.33s/it]                                                          {'loss': 2.4527, 'learning_rate': 1.2506158433813043e-07, 'epoch': 12.0}
 75%|███████▌  | 46440/61904 [1:43:02<27:10:21,  6.33s/it] 75%|███████▌  | 46441/61904 [1:43:03<20:55:43,  4.87s/it] 75%|███████▌  | 46442/61904 [1:43:05<16:29:49,  3.84s/it] 75%|███████▌  | 46443/61904 [1:43:06<13:28:42,  3.14s/it] 75%|███████▌  | 46444/61904 [1:43:08<11:29:30,  2.68s/it] 75%|███████▌  | 46445/61904 [1:43:09<9:53:21,  2.30s/it]  75%|███████▌  | 46446/61904 [1:43:11<8:38:04,  2.01s/it] 75%|███████▌  | 46447/61904 [1:43:12<8:09:47,  1.90s/it] 75%|███████▌  | 46448/61904 [1:43:14<7:37:23,  1.78s/it] 75%|███████▌  | 46449/61904 [1:43:15<7:16:07,  1.69s/it] 75%|███████▌  | 46450/61904 [1:43:17<6:55:58,  1.61s/it] 75%|███████▌  | 46451/61904 [1:43:18<6:49:45,  1.59s/it] 75%|███████▌  | 46452/61904 [1:43:20<6:34:49,  1.53s/it] 75%|███████▌  | 46453/61904 [1:43:21<6:30:23,  1.52s/it] 75%|███████▌  | 46454/61904 [1:43:23<6:24:05,  1.49s/it] 75%|███████▌  | 46455/61904 [1:43:24<6:11:39,  1.44s/it] 75%|███████▌  | 46456/61904 [1:43:25<6:00:46,  1.40s/it] 75%|███████▌  | 46457/61904 [1:43:27<6:07:43,  1.43s/it] 75%|███████▌  | 46458/61904 [1:43:28<5:58:29,  1.39s/it] 75%|███████▌  | 46459/61904 [1:43:30<6:02:24,  1.41s/it] 75%|███████▌  | 46460/61904 [1:43:31<6:05:42,  1.42s/it]                                                         {'loss': 2.436, 'learning_rate': 1.250291715285881e-07, 'epoch': 12.01}
 75%|███████▌  | 46460/61904 [1:43:31<6:05:42,  1.42s/it] 75%|███████▌  | 46461/61904 [1:43:32<5:59:07,  1.40s/it] 75%|███████▌  | 46462/61904 [1:43:34<6:19:38,  1.48s/it] 75%|███████▌  | 46463/61904 [1:43:35<6:04:33,  1.42s/it] 75%|███████▌  | 46464/61904 [1:43:37<6:06:03,  1.42s/it] 75%|███████▌  | 46465/61904 [1:43:38<5:56:54,  1.39s/it] 75%|███████▌  | 46466/61904 [1:43:40<6:05:41,  1.42s/it] 75%|███████▌  | 46467/61904 [1:43:41<6:33:40,  1.53s/it] 75%|███████▌  | 46468/61904 [1:43:43<6:11:53,  1.45s/it] 75%|███████▌  | 46469/61904 [1:43:44<6:02:19,  1.41s/it] 75%|███████▌  | 46470/61904 [1:43:45<5:58:53,  1.40s/it] 75%|███████▌  | 46471/61904 [1:43:47<6:09:47,  1.44s/it] 75%|███████▌  | 46472/61904 [1:43:48<6:04:29,  1.42s/it] 75%|███████▌  | 46473/61904 [1:43:49<5:57:32,  1.39s/it] 75%|███████▌  | 46474/61904 [1:43:51<6:04:04,  1.42s/it] 75%|███████▌  | 46475/61904 [1:43:52<6:07:06,  1.43s/it] 75%|███████▌  | 46476/61904 [1:43:54<6:03:32,  1.41s/it] 75%|███████▌  | 46477/61904 [1:43:55<6:01:12,  1.40s/it] 75%|███████▌  | 46478/61904 [1:43:57<6:06:32,  1.43s/it] 75%|███████▌  | 46479/61904 [1:43:58<6:13:43,  1.45s/it] 75%|███████▌  | 46480/61904 [1:44:00<6:08:51,  1.43s/it]                                                         {'loss': 2.4514, 'learning_rate': 1.2499675871904575e-07, 'epoch': 12.01}
 75%|███████▌  | 46480/61904 [1:44:00<6:08:51,  1.43s/it] 75%|███████▌  | 46481/61904 [1:44:01<6:03:09,  1.41s/it] 75%|███████▌  | 46482/61904 [1:44:02<6:12:59,  1.45s/it] 75%|███████▌  | 46483/61904 [1:44:04<6:12:53,  1.45s/it] 75%|███████▌  | 46484/61904 [1:44:05<6:09:21,  1.44s/it] 75%|███████▌  | 46485/61904 [1:44:07<6:21:03,  1.48s/it]