Training in progress, step 3000

Browse files

Files changed (7) hide show

merges.txt +0 -0
pytorch_model.bin +1 -1
special_tokens_map.json +9 -18
tokenizer.json +0 -0
tokenizer_config.json +25 -180
training_args.bin +1 -1
vocab.json +0 -0

merges.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:697c71dcd45523823f0044e309433b50ee2bee894aad330b14a76401b4ff10b0
 size 516646426

 version https://git-lfs.github.com/spec/v1
+oid sha256:328d503be14aeb0e66b16225df590fa42c3d7db64b79db73b9f975532ccb17c3
 size 516646426

special_tokens_map.json CHANGED Viewed

@@ -1,24 +1,15 @@
 {
- "bos_token": {
- "content": "<|endoftext|>",
- "lstrip": false,
  "normalized": false,
  "rstrip": false,
  "single_word": false
  },
- "eos_token": {
- "content": "<|endoftext|>",
- "lstrip": false,
- "normalized": false,
- "rstrip": false,
- "single_word": false
- },
- "pad_token": "<|endoftext|>",
- "unk_token": {
- "content": "<|endoftext|>",
- "lstrip": false,
- "normalized": false,
- "rstrip": false,
- "single_word": false
- }
 }

 {
+ "bos_token": "<s>",
+ "cls_token": "<s>",
+ "eos_token": "</s>",
+ "mask_token": {
+ "content": "<mask>",
+ "lstrip": true,
  "normalized": false,
  "rstrip": false,
  "single_word": false
  },
+ "pad_token": "</s>",
+ "sep_token": "</s>",
+ "unk_token": "<unk>"
 }

tokenizer.json CHANGED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json CHANGED Viewed

@@ -2,211 +2,56 @@
  "add_prefix_space": false,
  "added_tokens_decoder": {
  "0": {
- "content": "<|endoftext|>",
  "lstrip": false,
- "normalized": false,
  "rstrip": false,
  "single_word": false,
  "special": true
  },
  "1": {
- "content": "<|padding|>",
- "lstrip": false,
- "normalized": false,
- "rstrip": false,
- "single_word": false,
- "special": true
- },
- "50254": {
- "content": " ",
- "lstrip": false,
- "normalized": true,
- "rstrip": false,
- "single_word": false,
- "special": false
- },
- "50255": {
- "content": " ",
- "lstrip": false,
- "normalized": true,
- "rstrip": false,
- "single_word": false,
- "special": false
- },
- "50256": {
- "content": " ",
- "lstrip": false,
- "normalized": true,
- "rstrip": false,
- "single_word": false,
- "special": false
- },
- "50257": {
- "content": " ",
- "lstrip": false,
- "normalized": true,
- "rstrip": false,
- "single_word": false,
- "special": false
- },
- "50258": {
- "content": " ",
  "lstrip": false,
  "normalized": true,
  "rstrip": false,
  "single_word": false,
- "special": false
- },
- "50259": {
- "content": " ",
- "lstrip": false,
- "normalized": true,
- "rstrip": false,
- "single_word": false,
- "special": false
- },
- "50260": {
- "content": " ",
- "lstrip": false,
- "normalized": true,
- "rstrip": false,
- "single_word": false,
- "special": false
- },
- "50261": {
- "content": " ",
- "lstrip": false,
- "normalized": true,
- "rstrip": false,
- "single_word": false,
- "special": false
  },
- "50262": {
- "content": " ",
  "lstrip": false,
  "normalized": true,
  "rstrip": false,
  "single_word": false,
- "special": false
  },
- "50263": {
- "content": " ",
  "lstrip": false,
  "normalized": true,
  "rstrip": false,
  "single_word": false,
- "special": false
  },
  "50264": {
- "content": " ",
- "lstrip": false,
- "normalized": true,
- "rstrip": false,
- "single_word": false,
- "special": false
- },
- "50265": {
- "content": " ",
- "lstrip": false,
- "normalized": true,
- "rstrip": false,
- "single_word": false,
- "special": false
- },
- "50266": {
- "content": " ",
- "lstrip": false,
- "normalized": true,
- "rstrip": false,
- "single_word": false,
- "special": false
- },
- "50267": {
- "content": " ",
- "lstrip": false,
- "normalized": true,
- "rstrip": false,
- "single_word": false,
- "special": false
- },
- "50268": {
- "content": " ",
- "lstrip": false,
- "normalized": true,
- "rstrip": false,
- "single_word": false,
- "special": false
- },
- "50269": {
- "content": " ",
- "lstrip": false,
- "normalized": true,
- "rstrip": false,
- "single_word": false,
- "special": false
- },
- "50270": {
- "content": " ",
- "lstrip": false,
- "normalized": true,
- "rstrip": false,
- "single_word": false,
- "special": false
- },
- "50271": {
- "content": " ",
- "lstrip": false,
- "normalized": true,
- "rstrip": false,
- "single_word": false,
- "special": false
- },
- "50272": {
- "content": " ",
- "lstrip": false,
- "normalized": true,
- "rstrip": false,
- "single_word": false,
- "special": false
- },
- "50273": {
- "content": " ",
- "lstrip": false,
- "normalized": true,
- "rstrip": false,
- "single_word": false,
- "special": false
- },
- "50274": {
- "content": " ",
- "lstrip": false,
- "normalized": true,
- "rstrip": false,
- "single_word": false,
- "special": false
- },
- "50275": {
- "content": " ",
- "lstrip": false,
- "normalized": true,
- "rstrip": false,
- "single_word": false,
- "special": false
- },
- "50276": {
- "content": " ",
- "lstrip": false,
- "normalized": true,
  "rstrip": false,
  "single_word": false,
- "special": false
  }
  },
- "bos_token": "<|endoftext|>",
  "clean_up_tokenization_spaces": true,
- "eos_token": "<|endoftext|>",
- "model_max_length": 1000000000000000019884624838656,
- "pad_token": "<|endoftext|>",
- "tokenizer_class": "GPTNeoXTokenizer",
- "unk_token": "<|endoftext|>"
 }

  "add_prefix_space": false,
  "added_tokens_decoder": {
  "0": {
+ "content": "<s>",
  "lstrip": false,
+ "normalized": true,
  "rstrip": false,
  "single_word": false,
  "special": true
  },
  "1": {
+ "content": "<pad>",
  "lstrip": false,
  "normalized": true,
  "rstrip": false,
  "single_word": false,
+ "special": true
  },
+ "2": {
+ "content": "</s>",
  "lstrip": false,
  "normalized": true,
  "rstrip": false,
  "single_word": false,
+ "special": true
  },
+ "3": {
+ "content": "<unk>",
  "lstrip": false,
  "normalized": true,
  "rstrip": false,
  "single_word": false,
+ "special": true
  },
  "50264": {
+ "content": "<mask>",
+ "lstrip": true,
+ "normalized": false,
  "rstrip": false,
  "single_word": false,
+ "special": true
  }
  },
+ "bos_token": "<s>",
  "clean_up_tokenization_spaces": true,
+ "cls_token": "<s>",
+ "eos_token": "</s>",
+ "errors": "replace",
+ "mask_token": "<mask>",
+ "model_max_length": 512,
+ "pad_token": "</s>",
+ "sep_token": "</s>",
+ "tokenizer_class": "RobertaTokenizer",
+ "trim_offsets": true,
+ "unk_token": "<unk>"
 }

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:220541110edf0dd4c9581629e1d4a4b88691e9d10335bcc06429f95588df3e58
 size 4920

 version https://git-lfs.github.com/spec/v1
+oid sha256:4a6fe0e4567e1701aaf6ee56237285f8818ba05f18caeacc87856c8cb9f617f6
 size 4920

vocab.json ADDED Viewed

The diff for this file is too large to render. See raw diff