fede97 commited on
Commit
0d254c9
1 Parent(s): 9fe8d48

Upload 9 files

Browse files
scratch_2-nodes_tokenizer_latbert-original_packing_fcocchi/config.json ADDED
@@ -0,0 +1,31 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "activation_function": "gelu_new",
3
+ "architectures": [
4
+ "GPT2LMHeadModel"
5
+ ],
6
+ "attn_pdrop": 0.1,
7
+ "bos_token_id": 3,
8
+ "embd_pdrop": 0.1,
9
+ "eos_token_id": 2,
10
+ "initializer_range": 0.02,
11
+ "layer_norm_epsilon": 1e-05,
12
+ "model_type": "gpt2",
13
+ "n_embd": 768,
14
+ "n_head": 12,
15
+ "n_inner": null,
16
+ "n_layer": 12,
17
+ "n_positions": 1024,
18
+ "reorder_and_upcast_attn": false,
19
+ "resid_pdrop": 0.1,
20
+ "scale_attn_by_inverse_layer_idx": false,
21
+ "scale_attn_weights": true,
22
+ "summary_activation": null,
23
+ "summary_first_dropout": 0.1,
24
+ "summary_proj_to_labels": true,
25
+ "summary_type": "cls_index",
26
+ "summary_use_proj": true,
27
+ "torch_dtype": "float32",
28
+ "transformers_version": "4.35.0",
29
+ "use_cache": true,
30
+ "vocab_size": 32900
31
+ }
scratch_2-nodes_tokenizer_latbert-original_packing_fcocchi/generated_text.json ADDED
@@ -0,0 +1 @@
 
 
1
+ ["Quaeso te introducere in domum tuam, donec comedat et bibat. \u00bb ecce quod dicitur hic de uxore loth ; sed notandum quia non dixit # ad convivium @ # seu coenam invitabant se invicem fratres illius temporis quo abraham comedebat cum", "Quantum fit unum plus unum? vel dicendum, quod non est simile : quia idem numero existens in utroque tempore habet fieri ; unde tunc sequitur cum sint duo extrema motus secundum numerum esse diversa corpora. ad aliud dicitur", "Quae est caput imperii?", "Caput Graeciae est Athenae. Caput imperii est unum ab europa, et habet quattuor regna : asiam orientalem - dividit europamsemper indiae regnum ; hispaniam meridianamdecimam mediam atque persidem occidentalemquefonsam2 graeciam complectitur asia media", "Pater Noster, qui es in coelis ( matth. xxv ) @ # ; ut quod hic actum est ad litteram intelligatur et spiritualiter gestum : quia nos per fidem a cunctis quae agimus abstinemus carnis illecebris atque carnalibus desideriis resistendo illi soli placere satag", "Naturam expellas furca, ceraque et aceto cocta atque in ollam fictilem redacto ; deinde vino permixtum ieiunus imponat bibatque : hoc tantum ex pane fermentati mellis accipiat. [ cap", "Gl\u00f3ria Patri et F\u00edlio d\u00faderast, m\u00e9dia tibi \u00e1llide sunt m\u0153rentis.", "Ave, Maria, gr\u00e1tia plena, ut te laudent omnes boni ; \u2039h \u203aj et tibi dent mentem bonam! non sum sine fide. ergo nil obstat si fides in eo quem laudat attenditur? aut quae mihi spes est vel quis", "Myst\u00e9ria gaudiosa, ut ad vos perveniat ; quod utinam ita fiat. epistola ccxcix wibaldi abbatis beccensium", "Quis est pater Abrahae? Terah. Quis est pater Isaac? Abrahae. Quis est pater Iacob? et haec nomina si vultis scire, nemini hominum notiora sunt quam deo nostro ( ibid ) @ # : sicut superius jam diximus quomodo ad litteram intelligatur", "Aliena vitia in oculis habemus. si autem et illa recte agimus, non est ipsa sapientia quae jubet ut diligamus deum ; id enim solum diligit quod ad similitudinem suam creavit nos : sed ideo vere nobis praecipitur quidquid ab illo datum novimus bene vivendo possidere hoc", "Balbum melius balbi quam docti hominis esse oportet : cum idem in oratione multa doceat et dicat, quae non vult credere. sed quoniam haec per se ipsum scire est oratoris officium \u2014 id tamen hoc dico ; me neque tam doctu \u2039 mi", "Sed, ut dicere coeperamus. hoc autem et ad omnes christianos non pertinet ; nam per apostolum dictum est : # unicuique nostrum data sunt nada duo millia", "Fortasse quaerat aliquis, quomodo, inquam.", "credimus in unum deum dominum, dicentes ei : bene omnia fiunt. tunc unus cum fratre suo dixit ad illum ; quid est ille qui sic credit? cui frater respondit dicens de hoc quod vidit eum esse defunctum ex longo usu et postea mortuus sit propter nimiam", "et in unum dominum iesum christum, filium dei unigenitum. non tamen est factus a deo quasi alterum per naturam : quia hoc esset dare duos episcopos tantum post mortem suam ; sed quod natura illa quam deus tribuit super omnes substantias corporeas sit una persona numero", "Qui tetigerit picem inquinabitur ab eo. si autem de pane illo ederitis, morte moriemini ( ibid", "Stultitia est, qui in se nullum invenit locum ; aut hoc nescit. ille autem de quo scriptum fuerat : # sine iniquitate cucurrit pes meus ( ps 118 ) @ #? et quia omnes sibi amicos dixerat inimicos debere intelligi voluit eos quibus erat dicturus dominus", "Est modus in rebus, sunt et qui maxime dicantur. nec tamen omnino dicuntur esse ex essentia divina nisi secundum quod per unum cognitum possumus devenire ad cognitionem veritatis aliqualem vel accidentalem ; sicut dicimus fidem christi non habuisse veritatem naturae humanae sed divinae personae conveniente", "Faber est suae, qui ita sese habet."]
scratch_2-nodes_tokenizer_latbert-original_packing_fcocchi/generation_config.json ADDED
@@ -0,0 +1,6 @@
 
 
 
 
 
 
 
1
+ {
2
+ "_from_model_config": true,
3
+ "bos_token_id": 3,
4
+ "eos_token_id": 2,
5
+ "transformers_version": "4.35.0"
6
+ }
scratch_2-nodes_tokenizer_latbert-original_packing_fcocchi/model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:5f5b7fd40b3a610cc3941debe14daceeeec62ae222302842600235e2367ceeff
3
+ size 444453504
scratch_2-nodes_tokenizer_latbert-original_packing_fcocchi/special_tokens_map.json ADDED
@@ -0,0 +1,21 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "bos_token": {
3
+ "content": "[SEP]",
4
+ "lstrip": false,
5
+ "normalized": false,
6
+ "rstrip": false,
7
+ "single_word": false
8
+ },
9
+ "cls_token": "[CLS]",
10
+ "eos_token": {
11
+ "content": "[CLS]",
12
+ "lstrip": false,
13
+ "normalized": false,
14
+ "rstrip": false,
15
+ "single_word": false
16
+ },
17
+ "mask_token": "[MASK]",
18
+ "pad_token": "[PAD]",
19
+ "sep_token": "[SEP]",
20
+ "unk_token": "[UNK]"
21
+ }
scratch_2-nodes_tokenizer_latbert-original_packing_fcocchi/tokenizer.json ADDED
The diff for this file is too large to render. See raw diff
 
scratch_2-nodes_tokenizer_latbert-original_packing_fcocchi/tokenizer_config.json ADDED
@@ -0,0 +1,61 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "added_tokens_decoder": {
3
+ "0": {
4
+ "content": "[PAD]",
5
+ "lstrip": false,
6
+ "normalized": false,
7
+ "rstrip": false,
8
+ "single_word": false,
9
+ "special": true
10
+ },
11
+ "1": {
12
+ "content": "[UNK]",
13
+ "lstrip": false,
14
+ "normalized": false,
15
+ "rstrip": false,
16
+ "single_word": false,
17
+ "special": true
18
+ },
19
+ "2": {
20
+ "content": "[CLS]",
21
+ "lstrip": false,
22
+ "normalized": false,
23
+ "rstrip": false,
24
+ "single_word": false,
25
+ "special": true
26
+ },
27
+ "3": {
28
+ "content": "[SEP]",
29
+ "lstrip": false,
30
+ "normalized": false,
31
+ "rstrip": false,
32
+ "single_word": false,
33
+ "special": true
34
+ },
35
+ "4": {
36
+ "content": "[MASK]",
37
+ "lstrip": false,
38
+ "normalized": false,
39
+ "rstrip": false,
40
+ "single_word": false,
41
+ "special": true
42
+ }
43
+ },
44
+ "bos_token": "[SEP]",
45
+ "clean_up_tokenization_spaces": true,
46
+ "cls_token": "[CLS]",
47
+ "eos_token": "[CLS]",
48
+ "mask_token": "[MASK]",
49
+ "max_length": 512,
50
+ "model_max_length": 512,
51
+ "pad_to_multiple_of": null,
52
+ "pad_token": "[PAD]",
53
+ "pad_token_type_id": 0,
54
+ "padding_side": "right",
55
+ "sep_token": "[SEP]",
56
+ "stride": 0,
57
+ "tokenizer_class": "PreTrainedTokenizerFast",
58
+ "truncation_side": "right",
59
+ "truncation_strategy": "longest_first",
60
+ "unk_token": "[UNK]"
61
+ }
scratch_2-nodes_tokenizer_latbert-original_packing_fcocchi/trainer_state.json ADDED
The diff for this file is too large to render. See raw diff
 
scratch_2-nodes_tokenizer_latbert-original_packing_fcocchi/training_args.bin ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:497a956ee9bc1bcc7d4fd8ba508673d79d4524bf33685fac28f81c86411cad83
3
+ size 6008