Training in progress, step 1420

Files changed (5) hide show

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:565a6564b3c67792f8e6ae9df173f64885714a22f629655a844b33a267145359
 size 516667930

 version https://git-lfs.github.com/spec/v1
+oid sha256:c9aecbda310f3f427055f34c75d507886b6d66ed435ef7ad9ab2f0d22e971e1d
 size 516667930

special_tokens_map.json CHANGED Viewed

@@ -1,25 +1,7 @@
 {
- "bos_token": {
- "content": "<s>",
- "lstrip": false,
- "normalized": false,
- "rstrip": false,
- "single_word": false
- },
- "cls_token": {
- "content": "<s>",
- "lstrip": false,
- "normalized": false,
- "rstrip": false,
- "single_word": false
- },
- "eos_token": {
- "content": "</s>",
- "lstrip": false,
- "normalized": false,
- "rstrip": false,
- "single_word": false
- },
  "mask_token": {
  "content": "<mask>",
  "lstrip": true,
@@ -28,18 +10,6 @@
  "single_word": false
  },
  "pad_token": "</s>",
- "sep_token": {
- "content": "</s>",
- "lstrip": false,
- "normalized": false,
- "rstrip": false,
- "single_word": false
- },
- "unk_token": {
- "content": "<unk>",
- "lstrip": false,
- "normalized": false,
- "rstrip": false,
- "single_word": false
- }
 }

 {
+ "bos_token": "<s>",
+ "cls_token": "<s>",
+ "eos_token": "</s>",
  "mask_token": {
  "content": "<mask>",
  "lstrip": true,
  "single_word": false
  },
  "pad_token": "</s>",
+ "sep_token": "</s>",
+ "unk_token": "<unk>"
 }

tokenizer.json CHANGED Viewed

@@ -14,7 +14,7 @@
  "single_word": false,
  "lstrip": false,
  "rstrip": false,
- "normalized": false,
  "special": true
  },
  {
@@ -23,7 +23,7 @@
  "single_word": false,
  "lstrip": false,
  "rstrip": false,
- "normalized": false,
  "special": true
  },
  {
@@ -32,7 +32,7 @@
  "single_word": false,
  "lstrip": false,
  "rstrip": false,
- "normalized": false,
  "special": true
  },
  {
@@ -41,7 +41,7 @@
  "single_word": false,
  "lstrip": false,
  "rstrip": false,
- "normalized": false,
  "special": true
  },
  {

  "single_word": false,
  "lstrip": false,
  "rstrip": false,
+ "normalized": true,
  "special": true
  },
  {
  "single_word": false,
  "lstrip": false,
  "rstrip": false,
+ "normalized": true,
  "special": true
  },
  {
  "single_word": false,
  "lstrip": false,
  "rstrip": false,
+ "normalized": true,
  "special": true
  },
  {
  "single_word": false,
  "lstrip": false,
  "rstrip": false,
+ "normalized": true,
  "special": true
  },
  {

tokenizer_config.json CHANGED Viewed

@@ -4,7 +4,7 @@
  "0": {
  "content": "<s>",
  "lstrip": false,
- "normalized": false,
  "rstrip": false,
  "single_word": false,
  "special": true
@@ -12,7 +12,7 @@
  "1": {
  "content": "<pad>",
  "lstrip": false,
- "normalized": false,
  "rstrip": false,
  "single_word": false,
  "special": true
@@ -20,7 +20,7 @@
  "2": {
  "content": "</s>",
  "lstrip": false,
- "normalized": false,
  "rstrip": false,
  "single_word": false,
  "special": true
@@ -28,7 +28,7 @@
  "3": {
  "content": "<unk>",
  "lstrip": false,
- "normalized": false,
  "rstrip": false,
  "single_word": false,
  "special": true
@@ -48,17 +48,10 @@
  "eos_token": "</s>",
  "errors": "replace",
  "mask_token": "<mask>",
- "max_length": 128,
  "model_max_length": 512,
- "pad_to_multiple_of": null,
  "pad_token": "</s>",
- "pad_token_type_id": 0,
- "padding_side": "right",
  "sep_token": "</s>",
- "stride": 0,
  "tokenizer_class": "RobertaTokenizer",
  "trim_offsets": true,
- "truncation_side": "right",
- "truncation_strategy": "longest_first",
  "unk_token": "<unk>"
 }

  "0": {
  "content": "<s>",
  "lstrip": false,
+ "normalized": true,
  "rstrip": false,
  "single_word": false,
  "special": true
  "1": {
  "content": "<pad>",
  "lstrip": false,
+ "normalized": true,
  "rstrip": false,
  "single_word": false,
  "special": true
  "2": {
  "content": "</s>",
  "lstrip": false,
+ "normalized": true,
  "rstrip": false,
  "single_word": false,
  "special": true
  "3": {
  "content": "<unk>",
  "lstrip": false,
+ "normalized": true,
  "rstrip": false,
  "single_word": false,
  "special": true
  "eos_token": "</s>",
  "errors": "replace",
  "mask_token": "<mask>",
  "model_max_length": 512,
  "pad_token": "</s>",
  "sep_token": "</s>",
  "tokenizer_class": "RobertaTokenizer",
  "trim_offsets": true,
  "unk_token": "<unk>"
 }

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e16237a3ed634318bc29fd00a59b7e24d4cf42a8a3045b092209c27f970c2ca7
 size 4920

 version https://git-lfs.github.com/spec/v1
+oid sha256:624532f4d75723e55c8923721ea1a61f17755ef8232f19a0618de3be3e0590f9
 size 4920