pablosi commited on
Commit
61d0166
1 Parent(s): 8aebec7

Add new SentenceTransformer model

Browse files
.gitattributes CHANGED
@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
 
 
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
36
+ tokenizer.json filter=lfs diff=lfs merge=lfs -text
1_Pooling/config.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "word_embedding_dimension": 1024,
3
+ "pooling_mode_cls_token": true,
4
+ "pooling_mode_mean_tokens": false,
5
+ "pooling_mode_max_tokens": false,
6
+ "pooling_mode_mean_sqrt_len_tokens": false,
7
+ "pooling_mode_weightedmean_tokens": false,
8
+ "pooling_mode_lasttoken": false,
9
+ "include_prompt": true
10
+ }
README.md ADDED
@@ -0,0 +1,1162 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ language:
3
+ - es
4
+ license: apache-2.0
5
+ tags:
6
+ - sentence-transformers
7
+ - sentence-similarity
8
+ - feature-extraction
9
+ - generated_from_trainer
10
+ - dataset_size:5036
11
+ - loss:MatryoshkaLoss
12
+ - loss:MultipleNegativesRankingLoss
13
+ base_model: littlejohn-ai/bge-m3-spa-law-qa
14
+ widget:
15
+ - source_sentence: ¿Qué tipo de obras no dan derecho a practicar la deducción en viviendas?
16
+ sentences:
17
+ - 'en el Real Decreto
18
+
19
+ 2066/2008, de 12 de diciembre, por el que se regula el Plan Estatal de Vivienda
20
+ y
21
+
22
+ Rehabilitación 2009-2012, así como por las obras de instalación de infraestructuras
23
+
24
+ de telecomunicación realizadas durante dicho período que permitan el acceso a
25
+
26
+ Internet y a servicios de televisión digital en la vivienda del contribuyente.
27
+
28
+
29
+ No darán derecho a practicar esta deducción las obras que se realicen en
30
+
31
+
32
+
33
+ viviendas afectas a una actividad económica, plazas de garaje, jardines, parques,
34
+
35
+ piscinas e instalaciones deportivas y otros elementos análogos.
36
+
37
+
38
+ La base de esta deducción estará constituida por las cantidades satisfechas,
39
+
40
+
41
+
42
+ mediante tarjeta de crédito o débito, transferencia bancaria, cheque nominativo
43
+ o
44
+
45
+ ingreso en cuentas en entidades de crédito, a las personas o entidades que realicen
46
+
47
+ tales obras. En ningún caso, darán derecho a practicar esta deducción las cantidades
48
+
49
+ satisfechas mediante entregas de dinero de curso legal.
50
+
51
+
52
+
53
+ -----
54
+
55
+
56
+ # BOLETÍN OFICIAL DEL ESTADO
57
+
58
+
59
+
60
+ **Núm. 108** **Viernes 6 de mayo de 2011** **Sec. I. Pág. 45113**
61
+
62
+
63
+ La base máxima anual de esta deducción será de:
64
+
65
+
66
+
67
+ a) cuando la base imponible sea igual o inferior a 53.007,20 euros anuales:
68
+
69
+
70
+
71
+ 6.750 euros a'
72
+ - 's/kilogramo. apartado 3.
73
+
74
+ Materias inhibidoras (MI): 725.42 pesetas~k-equitox. 5. EI regimen de autorizaciones
75
+ para las operaciones
76
+
77
+ Sales solubles (SOL): 580.35 pesetas/Sm /centlme- a que hacen referencia los puntos
78
+ 3 y 4 debe ser el
79
+
80
+
81
+ tro. previsto por los artlculos 31 y 32 de la Ley de Presu-
82
+
83
+
84
+ Incremento de temperatura (IT): 0.007681 pese- puestos de 1995.
85
+
86
+ tas/metro cubico;oC.
87
+
88
+ Zona B. Artlculo 3. _Ordenaci6n de pagos._
89
+
90
+ Usos domesticos: 28.60 pesetas/metro cubico y Prd. Se anade al artlculo 48.1 del
91
+ texto refundido de la
92
+
93
+ Usos industriales: 35.91 pesetas/metro cubico y Prd. Ley de Finanzas Publicas
94
+ de Cataluna. aprobado por el
95
+
96
+ Materias en suspensi6n (MES): 36.26 pesetas/kilo- Decreto legislativo 9/1994.
97
+ de 13 de julio. un nuevo
98
+
99
+ gramo. . . parrafo con la siguiente redacci6n:
100
+
101
+ Materias oxidables (MO): 72.54 pesetas/kılogramo.
102
+
103
+
104
+ ."La ordenaci6n del pago puede efectuarse
105
+
106
+
107
+ Materias inhibidoras (MI): 725.42 pesetas~k-equitox.
108
+
109
+
110
+ mediante la. firma de una orden individual 0 de
111
+
112
+
113
+ Sales solubles (SOL): 580.35 pesetas/Sm /centfme-
114
+
115
+
116
+ un resumen elaborado por medios informaticos y
117
+
118
+
119
+ tro.
120
+
121
+
122
+ comprensivo de varias 6rdenes.»
123
+
124
+
125
+ Incremento de· temperatura (IT): 0.007681 pese-
126
+
127
+ tas/metro cubico;oC.
128
+
129
+
130
+ Disposici6n '
131
+ - ' de la Repúbl1ca
132
+
133
+
134
+ procedente. A dicho efecto, el Presidente de- la Subcomisión de
135
+
136
+
137
+ Argentina y el Ministerio de Trabajo de España efectuarán,
138
+
139
+
140
+ Salarios está facultado para dirigirse directamente a los ser-
141
+
142
+
143
+ #### de común acuerdO y con tres meses de antlcipac16n, la ~
144
+
145
+
146
+ vicios o Departamentos oficiales, cualquiera que sea su ads-
147
+
148
+
149
+ #### tiva programa.ción anua.l.
150
+
151
+
152
+ cripción administrativa, así como a los Organismos Sindicales,
153
+
154
+ recabando los datos e informes precisos y debiendo los Orgar ARTÍCULO nI
155
+
156
+
157
+ nismos requeridos cumplimentarlos en el pla:zo máXimo <le
158
+
159
+
160
+ quince días. Cada pa.ls otorgará al otro hasta cinco becas anuales para.
161
+
162
+
163
+ #### La SubcomisIón de Salarios elaborará cada tres meses un estudios de formación
164
+ y especialización en Centros relacionados
165
+
166
+ informe expres1vo de la evolución de las rentas·· saláriale...c; y con los temas
167
+ ql1e ~ hubieren selecclonado dé eom1in acuerdo.
168
+
169
+
170
+
171
+ -----
172
+
173
+
174
+ '
175
+ - source_sentence: ¿Qué se promoverá en cuanto a la participación de mujeres en la
176
+ economía?
177
+ sentences:
178
+ - Artículo 63. Coordinación de los poderes públicos de Andalucía para la igualdad
179
+ de mujeres y hombres. Se creará la Comisión de coordinación de las políticas autonómicas
180
+ y locales para la igualdad de género con el objeto de coordinar e impulsar la
181
+ integración del enfoque de género en las políticas y programas, en materia de
182
+ igualdad de mujeres y hombres, desarrollados por las distintas Administraciones
183
+ públicas de la Comunidad Autónoma.
184
+ - '# BOLETÍN OFICIAL DEL ESTADO
185
+
186
+
187
+
188
+ **Núm. 212** **Miércoles 4 de septiembre de 2013** **Sec. I. Pág. 64199**
189
+
190
+
191
+ ### I. DISPOSICIONES GENERALES
192
+
193
+
194
+
195
+ ## MINISTERIO DE INDUSTRIA, ENERGÍA Y TURISMO
196
+
197
+
198
+ #### 9326 Resolución de 27 de agosto de 2013, de la Secretaría de Estado de Turismo,
199
+
200
+ _por la que se publica el Acuerdo de Consejo de Ministros de 26 de julio de_
201
+
202
+ _2013, por el que se modifica en lo relativo a previsión de gastos financieros_
203
+
204
+ _del ICO y su financiación, el Acuerdo de 29 de mayo de 2009, que modificó la_
205
+
206
+ _normativa reguladora de los préstamos previstos en el Plan de Renovación de_
207
+
208
+ _Instalaciones Turísticas (Plan Renove Turismo 2009) del Ministerio de_
209
+
210
+ _Industria, Turismo y Comercio y amplió su dotación económica._
211
+
212
+
213
+
214
+ El Consejo de Ministros, en su reunión del 26 de julio de 2013, a propuesta de
215
+ los
216
+
217
+
218
+
219
+ Ministros de Industria Energía y Turismo, y de Economía y Competitividad adoptó
220
+ el
221
+
222
+ acuerdo referenciado en el título cuyo texto se inserta a continuación.
223
+
224
+
225
+ La normativa reguladora establecida en este acuerdo debe ser publicada en el
226
+
227
+
228
+
229
+ «Boletín Oficial del Estado», a tenor de lo establecido en el artículo 52.1 de
230
+ la Ley 30/1992,
231
+
232
+ de 26 de noviembre, de Régimen Jurídico de las Administracion'
233
+ - 7. La promoción del acceso a los recursos de todo tipo a las mujeres que viven
234
+ en el medio rural y su participación plena, igualitaria y efectiva en la economía
235
+ y en la sociedad.
236
+ - source_sentence: ¿Cuándo entró en vigor el presente anexo en España?
237
+ sentences:
238
+ - 'y
239
+
240
+ distantes entre sí. En cada una de estos lugares irán estibados cuando menos un
241
+ equipo de bombero y un
242
+
243
+ juego de equipo individual.
244
+
245
+
246
+
247
+ .6 Si la Administración de un Estado de abanderamiento considera que las disposiciones
248
+ en materia de equipos
249
+
250
+ obligatorios a bordo contenidas en la presente regla no son razonables o técnicamente
251
+ adecuadas, el buque
252
+
253
+ podrá ser eximido, con arreglo a lo dispuesto en el artículo 9, apartado 3, de
254
+ la presente Directiva, de una o
255
+
256
+ más de dichas disposiciones.
257
+
258
+
259
+ **12 Cuestiones diversas (R 18)**
260
+
261
+
262
+
263
+ BUQUES NUEVOS DE CLASES B, C y D y BUQUES EXISTENTES DE CLASE B:
264
+
265
+
266
+ .1 Cuando las divisiones de clase “A” estén perforadas para dar paso a cables
267
+ eléctricos, tuberías, troncos,
268
+
269
+ conductos, etc., o para aceptar esloras, baos u otros elementos estructurales,
270
+ se tomarán las medidas razonables
271
+
272
+ y practicables para que no disminuya la resistencia al fuego.
273
+
274
+
275
+
276
+ En lo que respecta a los buques construidos el 1 de enero de 2003 o posteriormente
277
+ cuyas divisiones de clase
278
+
279
+ “A” estén perforadas, estas perforaciones se someterán a prueba con arreglo al
280
+ Código de procedimientos de
281
+
282
+ ensayo de exposición al fuego para asegurarse de que no disminuya la resistencia
283
+ al fuego de las division'
284
+ - 'rma Internacional para Autorizaciones de Uso Terapéutico _(International_
285
+
286
+
287
+
288
+ _Standard for Therapeutic Use Exemptions)._
289
+
290
+
291
+
292
+ -----
293
+
294
+
295
+ # BOLETÍN OFICIAL DEL ESTADO
296
+
297
+
298
+ **Núm. 127** **Sábado 25 de mayo de 2024** **Sec. I. Pág. 59583**
299
+
300
+
301
+
302
+ PBD: pasaporte biológico del deportista.
303
+
304
+ programa del PBD: programa del pasaporte biológico del deportista.
305
+
306
+ sistema ADAMS: sistema de gestión y administración antidopaje (Anti-Doping
307
+
308
+ Administration and Management System).
309
+
310
+
311
+ TAD: Tribunal de Arbitraje Deportivo.
312
+
313
+ UGPD: unidad de gestión del pasaporte del deportista.
314
+
315
+
316
+
317
+ *******
318
+
319
+
320
+ El presente anexo entró en vigor, de forma general y para España, el 1 de enero
321
+
322
+ de 2023, de conformidad con lo establecido en el párrafo 3 del artículo 34 de
323
+ la
324
+
325
+ Convención Internacional contra el dopaje en el deporte.
326
+
327
+
328
+ Madrid, 17 de mayo de 2024.–La Secretaria General Técnica, Rosa Velázquez
329
+
330
+ Álvarez.
331
+
332
+
333
+
334
+ -----
335
+
336
+
337
+ '
338
+ - 'para la autorización de su puesta en circula-
339
+
340
+
341
+ General de Politica Arancelaria e Importación. previo informe ción, de acuerdo
342
+ ''con el Real Decreto 185111978, de 10 de julio,
343
+
344
+ de la Dirección'' General de la Energía del Ministerio da Indus- y disposiciones
345
+ concordantes.· .
346
+
347
+ ##### tria y Energia. El contingente establecido por la presente Orden 4. Las
348
+ Entidades Financieras que emitan participaciones
349
+
350
+ no será aplicable a las mercancias acogidas ''a cualquier modall- hipotece.rias
351
+ deberán comunicar mensualmente a la Dirección
352
+
353
+ ##### dad de tráfico de perfeccionamiento activo. _ General del Tesoro y Política
354
+ Financiera el volumen y caracte-
355
+
356
+
357
+ risticas financieras de las emitidas durante- el mes anterior.
358
+
359
+
360
+ Tercero.-Las expediciones de hulla coquizable que se impor-
361
+
362
+
363
+ ten en el año 1985 con li~ncias expedidas con cargo al contin- Tercero...~l. Las
364
+ Entidades Financieras que hubieran emi·
365
+
366
+ gente. libre de derechos, correspondiente a! año anterior se ad· tldo cédulas
367
+ .y'' bonqe hipotecarlos con la cobertura de présta-
368
+
369
+ mitirAn con libertad de derechos. debh:mdo deducirse por la mos hipotecarios convalidados..
370
+ deberán reinvertir el· producto
371
+
372
+ Dl.rección General de Política Arancelaria e Importación de la'
373
+ - source_sentence: ¿Qué se entiende por discriminación directa según la Ley?
374
+ sentences:
375
+ - ':e 0 (ım:ınt;?caire». c10nde
376
+
377
+
378
+ dı ee : «Ayudante de cort:ı.OOr ... 8», debe decır: «.''\j''Udante de
379
+
380
+
381
+ ###### 1\1 1 N 1 S TER 1 0 carta dar ... 9».
382
+
383
+
384
+ En i:ı mism::ı p:igina. Mcdisteria a la medida y en serıe, don-
385
+
386
+
387
+ ## n ! ... [k ] LA GOBERNACION de dice: «Ayudanta ." Sı), debe decir; «~ ... yudanta
388
+ .. , 9),
389
+
390
+
391
+ En el mismo «Boletin Ofici:ıl del Est~doı). pa~ina 10337, pri-
392
+
393
+
394
+ _RESOLUC!O_\''_ _de_ _la_ _Direcci6n General_ _de_ _sanidad_ por mera columna.
395
+ Corbateria y paİlOleri;ı d2 fanta.\ia, donde dice:·
396
+
397
+ _:a._ _fj!:c_ se _ciicWn_ 11 onnas _sobre_ _reconocimiento_ de _los_ «A~''Udante
398
+ ''" 8), debe decir: «A)''ud::ınte ... 9». En h misma _co-_
399
+
400
+ _("crda,_ _wcri/kacios_ _en_ _domicilios_ _particulares._ lumna. confecci6n de
401
+ sombreros ee senora, donde dice; «Aru-
402
+
403
+
404
+ dante de Planchado!'' .. , 8», dcbc decir: «Ayud:ı.nte de Plancha·
405
+
406
+
407
+ Proxima la :ech:ı cn quc las Jef:ıtur:ı.s de Sanidad han de dor ... 9». Eıı la
408
+ misma columna. Ve;os, man,os y mantillas. dorı­
409
+
410
+
411
+ ori:ı:ıizıl" e:-ı öu:; r(:ö~ectivas provinci:ı.s el reconocimiento oa- de dice:
412
+ «Ayudante ... 8». debe decir: «A)''udantc ... 9».
413
+
414
+
415
+ nit:ı:io de bs :cses porcin:.ıs sacrificada.s en domicilios particu- En el mismo
416
+ «Boleti!ı Oficial del Estado), p:i~jna '
417
+ - 'A los efectos de esta ley, se entiende por discriminación directa: Situación
418
+ en que se encuentra una persona o grupo en que se integra que sea, haya sido o
419
+ pudiera ser tratada de manera menos favorable que otras en situación análoga o
420
+ comparable por razón de orientación sexual e identidad sexual, expresión de género
421
+ o características sexuales.'
422
+ - '## I. Disposiciones generales
423
+
424
+
425
+ ### TRIBUNAL CONSTITUCIONAL asignaturasÁrt. 3.° Lospor alumnosrazón de queotrosobtenganestudios
426
+ lanacionalesconvalidacióno extrande­
427
+
428
+
429
+ jeros abonarán el 40 por 100 de las tasas establecidas para
430
+
431
+ las asignaturas sueltas. Las demás tasas se satisfarán en la
432
+
433
+ cuantía integra, en la medida en que incurren en el hecho
434
+
435
+
436
+ #### 21356 planteadoRECURSOporde inconstitucionalidadel Presidente del Gobiernonúmerocontra646/1984,la
437
+ imponible.
438
+
439
+ _Ley_ _1/1984,_ _de_ _20_ _de_ _febrero,_ _del_ _Parlamento_ _de_ DISPOSICION
440
+ FINAL
441
+
442
+ _Galicia._
443
+
444
+
445
+ Se autoriza a los Ministros de Economía y Hacienda y de
446
+
447
+
448
+ El Tribunal Constitucional, por providencia de 30 de agosto Cultura para dictar
449
+ las normas necesarias en orden a la apli­
450
+
451
+ actual, ha admitido a trámite el recurso de inconstitucionalidad cación del presente
452
+ Real Decreto.
453
+
454
+ número 646/1984, planteado por el Presidente del Gobierno, con­
455
+
456
+ tra la Ley 1/1984, de 20 de febrero, del Parlamento de Galicia, Dado en Madrid
457
+ a 12 de septiembre de 1984.
458
+
459
+ del fondo de compensación financiera. Y se hace saber que en
460
+
461
+ el mencionado recurso se ha invocado por el Presidente del JUAN CARLOS R.
462
+
463
+ Gobierno el artículo 161.2 de la Constitución, que produce de'
464
+ - source_sentence: ¿Cuál es la disposición que se refiere a la hora de cierre de los
465
+ establecimientos públicos en días laborables según el artículo 1.°?
466
+ sentences:
467
+ - "n de las adscripciones o representaciones a que\nse refieren distintos apartados\
468
+ \ del artículo 11,2 del citado De­\n\n#### Art. 2:° Los sábados y vísperas de\
469
+ \ días festivos, los espec- creto orgánico del Consejo Nacional de Educación,\
470
+ \ táculos podrán terminar y los establecimientos públicos podrán Este Ministerio,\
471
+ \ haciendo uso de las atribuciones que le con­ cerrar media hora más tarde de\
472
+ \ la que se determina en el fiere la disposición final segunda del citado Decreto\
473
+ \ orgánico, artículo l.° y de conformidad con el dictamen de la Asesoría Jurídica\
474
+ \ del\n Departamento, ha tenido a bien disponer lo siguiente:\n Art. 3.° La hora\
475
+ \ de cierre de los frontones podrá prorrogar­\nse excepcionalmente, en caso de\
476
+ \ empate de los partidos, hasta Primero.—Lo dispuesto en el artículo 14 del Decreto\
477
+ \ 2763/1971,\n\nde 21 de octubre, que organizó el Consejo Nacional de Educa­\n\
478
+ \n#### que sea necesaria, siempre que éstos hubieran comenzado a la hora establecida.\
479
+ \ ción, respecto de los Consejeros que lo fueran por razón de su\n cargo, debe\
480
+ \ entenderse no sólo respecto de los Consejeros natos,\n Art. 4.° Los bares interiores\
481
+ \ de los hoteles podrán retrasar sino también de los Consejeros designados por\
482
+ \ este Ministerio, su hora"
483
+ - 'o corrientes** 0330 ........................
484
+
485
+
486
+ **TOTAL ACTIVO (A+B)** 0340 ........................
487
+
488
+
489
+ **PASIVO Y PATRIMONIO NETO**
490
+
491
+
492
+
493
+ **A) PASIVO CORRIENTE** 0350 ........................
494
+
495
+
496
+ **I. Periodificaciones** 0360 ........................
497
+
498
+ **II. Acreedores y cuentas a pagar** 0370 ........................
499
+
500
+ **III. Deudas con empresas del grupo y asociadas a corto plazo** 0380 ........................
501
+
502
+ **IV. Deudas a corto plazo** 0390 ........................
503
+
504
+ **V. Provisiones a corto plazo** 0400 ........................
505
+
506
+ **VI. Otros pasivos corrientes** 0410 ........................
507
+
508
+
509
+ **B) PASIVO NO CORRIENTE** 0420 ........................
510
+
511
+
512
+ **I. Periodificaciones** 0430 ........................
513
+
514
+ **II. Pasivos por impuesto diferido** 0440 ........................
515
+
516
+ **III. Deudas con empresas del grupo y asociadas a largo plazo** 0450 ........................
517
+
518
+ **IV. Deudas a largo plazo** 0460 ........................
519
+
520
+ **V. Provisiones a largo plazo** 0470 ........................
521
+
522
+ **VI. Otros pasivos no corrientes** 0480 ........................
523
+
524
+ **TOTAL PASIVO (A+B)** 0490 ........................
525
+
526
+
527
+ **C) PATRIMONIO NETO** 0500 ........................
528
+
529
+
530
+ **C-1) FONDOS REEMBOLSABLES** 0510 ....'
531
+ - 'plan los requisitos previstos en el apartado 4 del
532
+
533
+ mencionado artículo 63.
534
+
535
+
536
+ 4. La Comisión Nacional de los Mercados y la Competencia revisará, en coordinación
537
+
538
+
539
+
540
+ con las autoridades reguladoras involucradas, el modelo adoptado en relación con
541
+ dichas
542
+
543
+ subastas regionales y su compatibilidad con el modelo de acoplamiento único intradiario
544
+ y
545
+
546
+ las subastas paneuropeas.
547
+
548
+
549
+ 5. Los ingresos obtenidos como resultado de la asignación de capacidad en el
550
+
551
+
552
+
553
+ mercado intradiario en la interconexión España-Francia y España-Portugal tendrán
554
+ la
555
+
556
+ consideración de «rentas de congestión».
557
+
558
+
559
+ 6. El Operador del Sistema y el Operador del Mercado aplicarán la metodología
560
+ para
561
+
562
+
563
+
564
+ la distribución de las rentas de congestión derivadas del acoplamiento del mercado
565
+
566
+ intradiario, según lo previsto en el artículo 73 del Reglamento (UE) 2015/1222.
567
+
568
+
569
+ Artículo 12. _Acoplamiento del mercado intradiario continuo europeo._
570
+
571
+
572
+
573
+ El mecanismo de acoplamiento del mercado intradiario continuo europeo seguirá
574
+ el
575
+
576
+
577
+
578
+ siguiente proceso:
579
+
580
+
581
+ 1. El Operador del Sistema calculará la capacidad de intercambio de cada
582
+
583
+
584
+
585
+ interconexión, según lo establecido en el artículo 14 del Reglamento (UE) 2015/1222,
586
+ en
587
+
588
+ coordinación con los operadores de los sis'
589
+ datasets:
590
+ - pablosi/boe_sintetic_question_context
591
+ pipeline_tag: sentence-similarity
592
+ library_name: sentence-transformers
593
+ metrics:
594
+ - cosine_accuracy@1
595
+ - cosine_accuracy@3
596
+ - cosine_accuracy@5
597
+ - cosine_accuracy@10
598
+ - cosine_precision@1
599
+ - cosine_precision@3
600
+ - cosine_precision@5
601
+ - cosine_precision@10
602
+ - cosine_recall@1
603
+ - cosine_recall@3
604
+ - cosine_recall@5
605
+ - cosine_recall@10
606
+ - cosine_ndcg@10
607
+ - cosine_mrr@10
608
+ - cosine_map@100
609
+ model-index:
610
+ - name: BGE large Legal Spanish Spa Law QA 2
611
+ results:
612
+ - task:
613
+ type: information-retrieval
614
+ name: Information Retrieval
615
+ dataset:
616
+ name: dim 1024
617
+ type: dim_1024
618
+ metrics:
619
+ - type: cosine_accuracy@1
620
+ value: 0.22817460317460317
621
+ name: Cosine Accuracy@1
622
+ - type: cosine_accuracy@3
623
+ value: 0.753968253968254
624
+ name: Cosine Accuracy@3
625
+ - type: cosine_accuracy@5
626
+ value: 0.8373015873015873
627
+ name: Cosine Accuracy@5
628
+ - type: cosine_accuracy@10
629
+ value: 0.876984126984127
630
+ name: Cosine Accuracy@10
631
+ - type: cosine_precision@1
632
+ value: 0.22817460317460317
633
+ name: Cosine Precision@1
634
+ - type: cosine_precision@3
635
+ value: 0.2513227513227513
636
+ name: Cosine Precision@3
637
+ - type: cosine_precision@5
638
+ value: 0.16746031746031748
639
+ name: Cosine Precision@5
640
+ - type: cosine_precision@10
641
+ value: 0.0876984126984127
642
+ name: Cosine Precision@10
643
+ - type: cosine_recall@1
644
+ value: 0.22817460317460317
645
+ name: Cosine Recall@1
646
+ - type: cosine_recall@3
647
+ value: 0.753968253968254
648
+ name: Cosine Recall@3
649
+ - type: cosine_recall@5
650
+ value: 0.8373015873015873
651
+ name: Cosine Recall@5
652
+ - type: cosine_recall@10
653
+ value: 0.876984126984127
654
+ name: Cosine Recall@10
655
+ - type: cosine_ndcg@10
656
+ value: 0.6037307215990698
657
+ name: Cosine Ndcg@10
658
+ - type: cosine_mrr@10
659
+ value: 0.5109780486268581
660
+ name: Cosine Mrr@10
661
+ - type: cosine_map@100
662
+ value: 0.516588227438603
663
+ name: Cosine Map@100
664
+ - task:
665
+ type: information-retrieval
666
+ name: Information Retrieval
667
+ dataset:
668
+ name: dim 768
669
+ type: dim_768
670
+ metrics:
671
+ - type: cosine_accuracy@1
672
+ value: 0.22420634920634921
673
+ name: Cosine Accuracy@1
674
+ - type: cosine_accuracy@3
675
+ value: 0.75
676
+ name: Cosine Accuracy@3
677
+ - type: cosine_accuracy@5
678
+ value: 0.8273809523809523
679
+ name: Cosine Accuracy@5
680
+ - type: cosine_accuracy@10
681
+ value: 0.878968253968254
682
+ name: Cosine Accuracy@10
683
+ - type: cosine_precision@1
684
+ value: 0.22420634920634921
685
+ name: Cosine Precision@1
686
+ - type: cosine_precision@3
687
+ value: 0.25
688
+ name: Cosine Precision@3
689
+ - type: cosine_precision@5
690
+ value: 0.1654761904761905
691
+ name: Cosine Precision@5
692
+ - type: cosine_precision@10
693
+ value: 0.08789682539682539
694
+ name: Cosine Precision@10
695
+ - type: cosine_recall@1
696
+ value: 0.22420634920634921
697
+ name: Cosine Recall@1
698
+ - type: cosine_recall@3
699
+ value: 0.75
700
+ name: Cosine Recall@3
701
+ - type: cosine_recall@5
702
+ value: 0.8273809523809523
703
+ name: Cosine Recall@5
704
+ - type: cosine_recall@10
705
+ value: 0.878968253968254
706
+ name: Cosine Recall@10
707
+ - type: cosine_ndcg@10
708
+ value: 0.6021352413233844
709
+ name: Cosine Ndcg@10
710
+ - type: cosine_mrr@10
711
+ value: 0.5083868732678256
712
+ name: Cosine Mrr@10
713
+ - type: cosine_map@100
714
+ value: 0.5138523153311494
715
+ name: Cosine Map@100
716
+ ---
717
+
718
+ # BGE large Legal Spanish Spa Law QA 2
719
+
720
+ This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [littlejohn-ai/bge-m3-spa-law-qa](https://huggingface.co/littlejohn-ai/bge-m3-spa-law-qa) on the [boe_sintetic_question_context](https://huggingface.co/datasets/pablosi/boe_sintetic_question_context) dataset. It maps sentences & paragraphs to a 1024-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
721
+
722
+ ## Model Details
723
+
724
+ ### Model Description
725
+ - **Model Type:** Sentence Transformer
726
+ - **Base model:** [littlejohn-ai/bge-m3-spa-law-qa](https://huggingface.co/littlejohn-ai/bge-m3-spa-law-qa) <!-- at revision 5242001c41c30df8f8f17db1196c81f71fe4f5bc -->
727
+ - **Maximum Sequence Length:** 8192 tokens
728
+ - **Output Dimensionality:** 1024 dimensions
729
+ - **Similarity Function:** Cosine Similarity
730
+ - **Training Dataset:**
731
+ - [boe_sintetic_question_context](https://huggingface.co/datasets/pablosi/boe_sintetic_question_context)
732
+ - **Language:** es
733
+ - **License:** apache-2.0
734
+
735
+ ### Model Sources
736
+
737
+ - **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
738
+ - **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
739
+ - **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
740
+
741
+ ### Full Model Architecture
742
+
743
+ ```
744
+ SentenceTransformer(
745
+ (0): Transformer({'max_seq_length': 8192, 'do_lower_case': False}) with Transformer model: XLMRobertaModel
746
+ (1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': True, 'pooling_mode_mean_tokens': False, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
747
+ (2): Normalize()
748
+ )
749
+ ```
750
+
751
+ ## Usage
752
+
753
+ ### Direct Usage (Sentence Transformers)
754
+
755
+ First install the Sentence Transformers library:
756
+
757
+ ```bash
758
+ pip install -U sentence-transformers
759
+ ```
760
+
761
+ Then you can load this model and run inference.
762
+ ```python
763
+ from sentence_transformers import SentenceTransformer
764
+
765
+ # Download from the 🤗 Hub
766
+ model = SentenceTransformer("pablosi/bge-m3-spa-law-qa-trained-2")
767
+ # Run inference
768
+ sentences = [
769
+ '¿Cuál es la disposición que se refiere a la hora de cierre de los establecimientos públicos en días laborables según el artículo 1.°?',
770
+ 'n de las adscripciones o representaciones a que\nse refieren distintos apartados del artículo 11,2 del citado De\xad\n\n#### Art. 2:° Los sábados y vísperas de días festivos, los espec- creto orgánico del Consejo Nacional de Educación, táculos podrán terminar y los establecimientos públicos podrán Este Ministerio, haciendo uso de las atribuciones que le con\xad cerrar media hora más tarde de la que se determina en el fiere la disposición final segunda del citado Decreto orgánico, artículo l.° y de conformidad con el dictamen de la Asesoría Jurídica del\n Departamento, ha tenido a bien disponer lo siguiente:\n Art. 3.° La hora de cierre de los frontones podrá prorrogar\xad\nse excepcionalmente, en caso de empate de los partidos, hasta Primero.—Lo dispuesto en el artículo 14 del Decreto 2763/1971,\n\nde 21 de octubre, que organizó el Consejo Nacional de Educa\xad\n\n#### que sea necesaria, siempre que éstos hubieran comenzado a la hora establecida. ción, respecto de los Consejeros que lo fueran por razón de su\n cargo, debe entenderse no sólo respecto de los Consejeros natos,\n Art. 4.° Los bares interiores de los hoteles podrán retrasar sino también de los Consejeros designados por este Ministerio, su hora',
771
+ 'o corrientes** 0330 ........................\n\n**TOTAL ACTIVO (A+B)** 0340 ........................\n\n**PASIVO Y PATRIMONIO NETO**\n\n\n**A) PASIVO CORRIENTE** 0350 ........................\n\n**I. Periodificaciones** 0360 ........................\n**II. Acreedores y cuentas a pagar** 0370 ........................\n**III. Deudas con empresas del grupo y asociadas a corto plazo** 0380 ........................\n**IV. Deudas a corto plazo** 0390 ........................\n**V. Provisiones a corto plazo** 0400 ........................\n**VI. Otros pasivos corrientes** 0410 ........................\n\n**B) PASIVO NO CORRIENTE** 0420 ........................\n\n**I. Periodificaciones** 0430 ........................\n**II. Pasivos por impuesto diferido** 0440 ........................\n**III. Deudas con empresas del grupo y asociadas a largo plazo** 0450 ........................\n**IV. Deudas a largo plazo** 0460 ........................\n**V. Provisiones a largo plazo** 0470 ........................\n**VI. Otros pasivos no corrientes** 0480 ........................\n**TOTAL PASIVO (A+B)** 0490 ........................\n\n**C) PATRIMONIO NETO** 0500 ........................\n\n**C-1) FONDOS REEMBOLSABLES** 0510 ....',
772
+ ]
773
+ embeddings = model.encode(sentences)
774
+ print(embeddings.shape)
775
+ # [3, 1024]
776
+
777
+ # Get the similarity scores for the embeddings
778
+ similarities = model.similarity(embeddings, embeddings)
779
+ print(similarities.shape)
780
+ # [3, 3]
781
+ ```
782
+
783
+ <!--
784
+ ### Direct Usage (Transformers)
785
+
786
+ <details><summary>Click to see the direct usage in Transformers</summary>
787
+
788
+ </details>
789
+ -->
790
+
791
+ <!--
792
+ ### Downstream Usage (Sentence Transformers)
793
+
794
+ You can finetune this model on your own dataset.
795
+
796
+ <details><summary>Click to expand</summary>
797
+
798
+ </details>
799
+ -->
800
+
801
+ <!--
802
+ ### Out-of-Scope Use
803
+
804
+ *List how the model may foreseeably be misused and address what users ought not to do with the model.*
805
+ -->
806
+
807
+ ## Evaluation
808
+
809
+ ### Metrics
810
+
811
+ #### Information Retrieval
812
+
813
+ * Datasets: `dim_1024` and `dim_768`
814
+ * Evaluated with [<code>InformationRetrievalEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.InformationRetrievalEvaluator)
815
+
816
+ | Metric | dim_1024 | dim_768 |
817
+ |:--------------------|:-----------|:-----------|
818
+ | cosine_accuracy@1 | 0.2282 | 0.2242 |
819
+ | cosine_accuracy@3 | 0.754 | 0.75 |
820
+ | cosine_accuracy@5 | 0.8373 | 0.8274 |
821
+ | cosine_accuracy@10 | 0.877 | 0.879 |
822
+ | cosine_precision@1 | 0.2282 | 0.2242 |
823
+ | cosine_precision@3 | 0.2513 | 0.25 |
824
+ | cosine_precision@5 | 0.1675 | 0.1655 |
825
+ | cosine_precision@10 | 0.0877 | 0.0879 |
826
+ | cosine_recall@1 | 0.2282 | 0.2242 |
827
+ | cosine_recall@3 | 0.754 | 0.75 |
828
+ | cosine_recall@5 | 0.8373 | 0.8274 |
829
+ | cosine_recall@10 | 0.877 | 0.879 |
830
+ | **cosine_ndcg@10** | **0.6037** | **0.6021** |
831
+ | cosine_mrr@10 | 0.511 | 0.5084 |
832
+ | cosine_map@100 | 0.5166 | 0.5139 |
833
+
834
+ <!--
835
+ ## Bias, Risks and Limitations
836
+
837
+ *What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
838
+ -->
839
+
840
+ <!--
841
+ ### Recommendations
842
+
843
+ *What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
844
+ -->
845
+
846
+ ## Training Details
847
+
848
+ ### Training Dataset
849
+
850
+ #### boe_sintetic_question_context
851
+
852
+ * Dataset: [boe_sintetic_question_context](https://huggingface.co/datasets/pablosi/boe_sintetic_question_context) at [2391ba7](https://huggingface.co/datasets/pablosi/boe_sintetic_question_context/tree/2391ba719dd5798b09c08f4afa5eb93d95d7581b)
853
+ * Size: 5,036 training samples
854
+ * Columns: <code>question</code> and <code>context</code>
855
+ * Approximate statistics based on the first 1000 samples:
856
+ | | question | context |
857
+ |:--------|:----------------------------------------------------------------------------------|:------------------------------------------------------------------------------------|
858
+ | type | string | string |
859
+ | details | <ul><li>min: 3 tokens</li><li>mean: 26.99 tokens</li><li>max: 66 tokens</li></ul> | <ul><li>min: 2 tokens</li><li>mean: 279.97 tokens</li><li>max: 964 tokens</li></ul> |
860
+ * Samples:
861
+ | question | context |
862
+ |:------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
863
+ | <code>¿Cuáles son las funciones que corresponden a la Vicesecretaría General Técnica en relación con el régimen interior y económico?</code> | <code>Explotación<br><br>###### Artículo octavo y de Señales Marítimas.<br><br>A la Vicesecretaría General Técnica corresponden las funcio~<br><br>nes relativas al régimen interior y económico, información, _Artículo decimosexto_<br>iniciativas, derecho de petición, archivo, biblioteca, documen-<br><br>La Dirección General de Transportes Terrestres estará. inte-<br><br>tación, relaciones internacionales y demás que le encomiende<br><br>grada por las siguientes unidades:<br><br>el Secretario general Técnico.<br><br> - Subdirección General de Planificación y Obras.<br><br>###### Articulo noveno - Subdirección General de Explotación.<br><br>La Subdirección General de Programación Económica. tendrá _Artículo decimoséptimo_<br>a. su 'cargo la realización de estudios económicos, elaboración<br>de las estadisticas del Departamento, estudios y proyectos de A la Subdirección General de Planificación y Obras le, correS'"<br>financiación e informes sobre inversiones y realizaciones del ponderá el examen de anteproye...</code> |
864
+ | <code>¿Qué tipo de documentación oficial deben exhibir los funcionarios y agentes de las administraciones comunes del país limitrofe para acreditar su nacionalidad, identidad, calidad y naturaleza de sus funciones?</code> | <code>ones conı­<br>neD!"'.! . bajo lOS :ıuspicios de la Comisi6n econ6mic:ı Europea petent,sdel pais limitrofe deberiıı llevar el uniforme ıiacional<br>con el fin. _de_ !'acilitar el paso de ıa. fronteras a l:l.'i memıncias o el signo discintivo prescl'ito por los reglamentos de dicho pais.<br>transportadas POl' via .fcrrea. 3. 10s funcionarios y agentes de las administraciones com-<br>aeuerdan 10 siguiente': petentes del pais limitrofe que tengaıı que dirigirse a La esıa­<br><br>cl6n p:mi la reallzacl6n de la.> ln,pecciones previstas POl' ci pre-<br><br>TITULOI sente Convenio queoar:ın dispensados de las formalidades de<br><br>pasaportes. La exhibici6n de su documentaci6n cficial ser:i. su-<br><br>CreQ~on y regiınen _de_ cstadorıt's _de_ _jronterQ_ _con_ _inspectiones_ ficiente para acreditar su nacionalidad. su jdenıidad. su ca.lidad<br><br>nC!dr...~a.!rz ;:u.:::ta-p--.ıcsta:; y la naturaleza de sus funcia:ıes.<br><br>4. LCIlI lunciona.rios )' agent.>s mencıonad05 en 105 parra-<br><br>Artıculo primero fas 2 y 3 de! presente articulo recibiri...</code> |
865
+ | <code>¿Cuál es el período máximo de vinculación provisional o a prueba que pueden establecer los estatutos de una sociedad cooperativa de segundo grado?</code> | <code>ría en los estatutos, que también podrá regular un período de vinculación<br>provisional o a prueba de hasta dos años.<br><br>3. El socio persona jurídica que pretenda darse de baja habrá de cursar un preaviso<br>de al menos un año. Trascurrido el periodo de preaviso y antes de su efectiva separación<br>estará obligado a cumplir las obligaciones contraídas con la sociedad cooperativa de<br>segundo grado o a resarcirla económicamente, si así lo decide el consejo rector de esta.<br>Asimismo, salvo previsión estatutaria en contra, la entidad separada deberá continuar<br>desarrollando, durante un plazo no inferior a dos años, aquellos compromisos adquiridos<br>que hubiera asumido con anterioridad a la fecha de la baja.<br><br>Artículo 132. Régimen económico.<br><br><br>Las aportaciones obligatorias al capital social de una sociedad cooperativa de<br>segundo grado se realizarán en función de la actividad cooperativizada comprometida<br>con aquella por cada socio.<br><br>Artículo 133. Órganos sociales.<br><br><br>1. La asamblea general estará formada po...</code> |
866
+ * Loss: [<code>MatryoshkaLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#matryoshkaloss) with these parameters:
867
+ ```json
868
+ {
869
+ "loss": "MultipleNegativesRankingLoss",
870
+ "matryoshka_dims": [
871
+ 1024,
872
+ 768
873
+ ],
874
+ "matryoshka_weights": [
875
+ 1,
876
+ 1
877
+ ],
878
+ "n_dims_per_step": -1
879
+ }
880
+ ```
881
+
882
+ ### Evaluation Dataset
883
+
884
+ #### boe_sintetic_question_context
885
+
886
+ * Dataset: [boe_sintetic_question_context](https://huggingface.co/datasets/pablosi/boe_sintetic_question_context) at [2391ba7](https://huggingface.co/datasets/pablosi/boe_sintetic_question_context/tree/2391ba719dd5798b09c08f4afa5eb93d95d7581b)
887
+ * Size: 5,036 evaluation samples
888
+ * Columns: <code>question</code> and <code>context</code>
889
+ * Approximate statistics based on the first 1000 samples:
890
+ | | question | context |
891
+ |:--------|:----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|
892
+ | type | string | string |
893
+ | details | <ul><li>min: 4 tokens</li><li>mean: 27.32 tokens</li><li>max: 64 tokens</li></ul> | <ul><li>min: 20 tokens</li><li>mean: 269.89 tokens</li><li>max: 787 tokens</li></ul> |
894
+ * Samples:
895
+ | question | context |
896
+ |:---------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
897
+ | <code>¿Qué tipo de productos están excluidos de la aplicación del Real Decreto 1801/2003, de 26 de diciembre, sobre seguridad general de los productos?</code> | <code>1801/2003, de 26<br>de diciembre, sobre seguridad general de los productos,<br>para aquellos productos afectados por este real decreto, a<br>excepción de los productos de renovación del acabado de<br>vehículos.<br>b) Las previstas en la Ley 21/1992, de 16 de julio, de<br>Industria, para los productos de renovación del acabado<br>de vehículos afectados por este real decreto.<br><br>2. Los productos objeto de este real decreto serán<br>considerados seguros cuando cumplan, además de los<br>requisitos que les sean exigibles por la legislación vigente,<br>lo dispuesto en este real decreto.<br><br><br>Artículo 6. _Información_ _al_ _Ministerio_ _de_ _Medio_<br>_Ambiente._<br><br>Las comunidades autónomas remitirán al Ministerio de<br>Medio Ambiente un informe que contenga los resultados<br>de las medidas del programa de control al que se refiere el<br>artículo 5 y una relación de las categorías y cantidades de<br>producto para cuya compraventa hayan concedido permisos, según lo dispuesto en la disposición adicional<br>segunda, a efectos de su comunicación a l...</code> |
898
+ | <code>¿En qué artículo de la Constitución se basa el Estado para dictar la legislación procesal mencionada en el texto?</code> | <code>tencia estatal._<br><br>Esta Ley Orgánica se dicta en ejercicio de las competencias atribuidas al Estado en materia de legislación<br>procesal por el artículo 149.1.6.ª de la Constitución.<br><br><br>Disposición final segunda. _Entrada en vigor._<br><br>La presente Ley Orgánica entrará en vigor el día<br>siguiente al de su publicación en el «Boletín Oficial del<br>Estado».<br><br>Por tanto,<br>Mando a todos los españoles, particulares y autoridades, que guarden y hagan guardar esta Ley Orgánica.<br><br>Madrid, 5 de junio de 2006.<br><br>JUAN CARLOS R.<br><br>El Presidente del Gobierno,<br><br>JOSÉ LUIS RODRÍGUEZ ZAPATERO<br><br>### 9958 LEY 17/2006, de 5 de junio, de la radio y la tele_visión de titularidad estatal._<br><br>JUAN CARLOS I<br><br>REY DE ESPAÑA<br><br>A todos los que la presente vieren y entendieren.<br>Sabed: Que las Cortes Generales han aprobado y Yo<br>vengo en sancionar la siguiente Ley.<br><br>EXPOSICIÓN DE MOTIVOS<br><br>La Constitución en su artículo 20 garantiza valores de<br>pluralismo, veracidad y accesibilidad con el fin de contribuir a la formación de una opinión pú...</code> |
899
+ | <code>¿Cuál es el propósito principal de la Comisión Mixta establecida en el Artículo 30?</code> | <code> Organismos de Enlace de ambas Partes intercambiarán los datos estadísticos relativos a los pagos de<br>prestaciones efectuados a los beneficiarios de una Parte<br>que residan en el territorio de la otra Parte. Dichos datos<br>contendrán el número de beneficiarios y el importe total<br>de las prestaciones abonadas durante cada año civil.<br>2. Las Autoridades y los Organismos de Enlace de<br>ambas Partes estarán obligados a facilitar, cuando les<br>sean requeridos por la otra Parte, toda la información y<br>datos sobre los sistemas de cálculo de los costes de las<br>prestaciones sanitarias.<br><br>Artículo 30. _Comisión Mixta._<br><br>Con el fin de resolver cuantos problemas puedan surgir en aplicación del Convenio y el presente Acuerdo<br>Administrativo, así como para el seguimiento de los mismos, las Autoridades Competentes de ambas Partes<br>podrán reunirse en Comisión Mixta, asistidas por representantes de sus respectivas Instituciones Competentes.<br><br>Artículo 31. _Pago de prestaciones._<br><br>Las prestaciones que, conforme a la leg...</code> |
900
+ * Loss: [<code>MatryoshkaLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#matryoshkaloss) with these parameters:
901
+ ```json
902
+ {
903
+ "loss": "MultipleNegativesRankingLoss",
904
+ "matryoshka_dims": [
905
+ 1024,
906
+ 768
907
+ ],
908
+ "matryoshka_weights": [
909
+ 1,
910
+ 1
911
+ ],
912
+ "n_dims_per_step": -1
913
+ }
914
+ ```
915
+
916
+ ### Training Hyperparameters
917
+ #### Non-Default Hyperparameters
918
+
919
+ - `eval_strategy`: epoch
920
+ - `per_device_train_batch_size`: 16
921
+ - `per_device_eval_batch_size`: 16
922
+ - `gradient_accumulation_steps`: 16
923
+ - `learning_rate`: 2e-05
924
+ - `num_train_epochs`: 8
925
+ - `lr_scheduler_type`: cosine
926
+ - `warmup_ratio`: 0.1
927
+ - `bf16`: True
928
+ - `tf32`: True
929
+ - `dataloader_num_workers`: 4
930
+ - `load_best_model_at_end`: True
931
+ - `optim`: adamw_torch_fused
932
+ - `gradient_checkpointing`: True
933
+ - `batch_sampler`: no_duplicates
934
+
935
+ #### All Hyperparameters
936
+ <details><summary>Click to expand</summary>
937
+
938
+ - `overwrite_output_dir`: False
939
+ - `do_predict`: False
940
+ - `eval_strategy`: epoch
941
+ - `prediction_loss_only`: True
942
+ - `per_device_train_batch_size`: 16
943
+ - `per_device_eval_batch_size`: 16
944
+ - `per_gpu_train_batch_size`: None
945
+ - `per_gpu_eval_batch_size`: None
946
+ - `gradient_accumulation_steps`: 16
947
+ - `eval_accumulation_steps`: None
948
+ - `torch_empty_cache_steps`: None
949
+ - `learning_rate`: 2e-05
950
+ - `weight_decay`: 0.0
951
+ - `adam_beta1`: 0.9
952
+ - `adam_beta2`: 0.999
953
+ - `adam_epsilon`: 1e-08
954
+ - `max_grad_norm`: 1.0
955
+ - `num_train_epochs`: 8
956
+ - `max_steps`: -1
957
+ - `lr_scheduler_type`: cosine
958
+ - `lr_scheduler_kwargs`: {}
959
+ - `warmup_ratio`: 0.1
960
+ - `warmup_steps`: 0
961
+ - `log_level`: passive
962
+ - `log_level_replica`: warning
963
+ - `log_on_each_node`: True
964
+ - `logging_nan_inf_filter`: True
965
+ - `save_safetensors`: True
966
+ - `save_on_each_node`: False
967
+ - `save_only_model`: False
968
+ - `restore_callback_states_from_checkpoint`: False
969
+ - `no_cuda`: False
970
+ - `use_cpu`: False
971
+ - `use_mps_device`: False
972
+ - `seed`: 42
973
+ - `data_seed`: None
974
+ - `jit_mode_eval`: False
975
+ - `use_ipex`: False
976
+ - `bf16`: True
977
+ - `fp16`: False
978
+ - `fp16_opt_level`: O1
979
+ - `half_precision_backend`: auto
980
+ - `bf16_full_eval`: False
981
+ - `fp16_full_eval`: False
982
+ - `tf32`: True
983
+ - `local_rank`: 0
984
+ - `ddp_backend`: None
985
+ - `tpu_num_cores`: None
986
+ - `tpu_metrics_debug`: False
987
+ - `debug`: []
988
+ - `dataloader_drop_last`: False
989
+ - `dataloader_num_workers`: 4
990
+ - `dataloader_prefetch_factor`: None
991
+ - `past_index`: -1
992
+ - `disable_tqdm`: False
993
+ - `remove_unused_columns`: True
994
+ - `label_names`: None
995
+ - `load_best_model_at_end`: True
996
+ - `ignore_data_skip`: False
997
+ - `fsdp`: []
998
+ - `fsdp_min_num_params`: 0
999
+ - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
1000
+ - `fsdp_transformer_layer_cls_to_wrap`: None
1001
+ - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
1002
+ - `deepspeed`: None
1003
+ - `label_smoothing_factor`: 0.0
1004
+ - `optim`: adamw_torch_fused
1005
+ - `optim_args`: None
1006
+ - `adafactor`: False
1007
+ - `group_by_length`: False
1008
+ - `length_column_name`: length
1009
+ - `ddp_find_unused_parameters`: None
1010
+ - `ddp_bucket_cap_mb`: None
1011
+ - `ddp_broadcast_buffers`: False
1012
+ - `dataloader_pin_memory`: True
1013
+ - `dataloader_persistent_workers`: False
1014
+ - `skip_memory_metrics`: True
1015
+ - `use_legacy_prediction_loop`: False
1016
+ - `push_to_hub`: False
1017
+ - `resume_from_checkpoint`: None
1018
+ - `hub_model_id`: None
1019
+ - `hub_strategy`: every_save
1020
+ - `hub_private_repo`: False
1021
+ - `hub_always_push`: False
1022
+ - `gradient_checkpointing`: True
1023
+ - `gradient_checkpointing_kwargs`: None
1024
+ - `include_inputs_for_metrics`: False
1025
+ - `include_for_metrics`: []
1026
+ - `eval_do_concat_batches`: True
1027
+ - `fp16_backend`: auto
1028
+ - `push_to_hub_model_id`: None
1029
+ - `push_to_hub_organization`: None
1030
+ - `mp_parameters`:
1031
+ - `auto_find_batch_size`: False
1032
+ - `full_determinism`: False
1033
+ - `torchdynamo`: None
1034
+ - `ray_scope`: last
1035
+ - `ddp_timeout`: 1800
1036
+ - `torch_compile`: False
1037
+ - `torch_compile_backend`: None
1038
+ - `torch_compile_mode`: None
1039
+ - `dispatch_batches`: None
1040
+ - `split_batches`: None
1041
+ - `include_tokens_per_second`: False
1042
+ - `include_num_input_tokens_seen`: False
1043
+ - `neftune_noise_alpha`: None
1044
+ - `optim_target_modules`: None
1045
+ - `batch_eval_metrics`: False
1046
+ - `eval_on_start`: False
1047
+ - `use_liger_kernel`: False
1048
+ - `eval_use_gather_object`: False
1049
+ - `average_tokens_across_devices`: False
1050
+ - `prompts`: None
1051
+ - `batch_sampler`: no_duplicates
1052
+ - `multi_dataset_batch_sampler`: proportional
1053
+
1054
+ </details>
1055
+
1056
+ ### Training Logs
1057
+ | Epoch | Step | Training Loss | Validation Loss | dim_1024_cosine_ndcg@10 | dim_768_cosine_ndcg@10 |
1058
+ |:----------:|:------:|:-------------:|:---------------:|:-----------------------:|:----------------------:|
1059
+ | 0.2817 | 5 | 0.3683 | - | - | - |
1060
+ | 0.5634 | 10 | 0.2652 | - | - | - |
1061
+ | 0.8451 | 15 | 0.1906 | - | - | - |
1062
+ | **0.9577** | **17** | **-** | **0.1344** | **0.6292** | **0.6278** |
1063
+ | 1.1549 | 20 | 0.1341 | - | - | - |
1064
+ | 1.4366 | 25 | 0.1358 | - | - | - |
1065
+ | 1.7183 | 30 | 0.0547 | - | - | - |
1066
+ | 1.9437 | 34 | - | 0.1179 | 0.6247 | 0.6198 |
1067
+ | 2.0282 | 35 | 0.0553 | - | - | - |
1068
+ | 2.3099 | 40 | 0.0433 | - | - | - |
1069
+ | 2.5915 | 45 | 0.0376 | - | - | - |
1070
+ | 2.8732 | 50 | 0.0248 | - | - | - |
1071
+ | 2.9296 | 51 | - | 0.1209 | 0.6203 | 0.6152 |
1072
+ | 3.1831 | 55 | 0.0209 | - | - | - |
1073
+ | 3.4648 | 60 | 0.0246 | - | - | - |
1074
+ | 3.7465 | 65 | 0.0119 | - | - | - |
1075
+ | 3.9718 | 69 | - | 0.1167 | 0.6194 | 0.6133 |
1076
+ | 4.0563 | 70 | 0.014 | - | - | - |
1077
+ | 4.3380 | 75 | 0.0164 | - | - | - |
1078
+ | 4.6197 | 80 | 0.0117 | - | - | - |
1079
+ | 4.9014 | 85 | 0.0091 | - | - | - |
1080
+ | 4.9577 | 86 | - | 0.1234 | 0.6046 | 0.6067 |
1081
+ | 5.2113 | 90 | 0.0082 | - | - | - |
1082
+ | 5.4930 | 95 | 0.0119 | - | - | - |
1083
+ | 5.7746 | 100 | 0.0061 | - | - | - |
1084
+ | 5.9437 | 103 | - | 0.1288 | 0.6050 | 0.6018 |
1085
+ | 6.0845 | 105 | 0.0069 | - | - | - |
1086
+ | 6.3662 | 110 | 0.0133 | - | - | - |
1087
+ | 6.6479 | 115 | 0.0059 | - | - | - |
1088
+ | 6.9296 | 120 | 0.006 | 0.1301 | 0.5960 | 0.5984 |
1089
+ | 7.2394 | 125 | 0.0061 | - | - | - |
1090
+ | 7.5211 | 130 | 0.0101 | - | - | - |
1091
+ | 7.8028 | 135 | 0.005 | - | - | - |
1092
+ | 7.8592 | 136 | - | 0.1305 | 0.6037 | 0.6021 |
1093
+
1094
+ * The bold row denotes the saved checkpoint.
1095
+
1096
+ ### Framework Versions
1097
+ - Python: 3.10.14
1098
+ - Sentence Transformers: 3.3.0
1099
+ - Transformers: 4.46.2
1100
+ - PyTorch: 2.2.2
1101
+ - Accelerate: 1.1.1
1102
+ - Datasets: 3.1.0
1103
+ - Tokenizers: 0.20.3
1104
+
1105
+ ## Citation
1106
+
1107
+ ### BibTeX
1108
+
1109
+ #### Sentence Transformers
1110
+ ```bibtex
1111
+ @inproceedings{reimers-2019-sentence-bert,
1112
+ title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
1113
+ author = "Reimers, Nils and Gurevych, Iryna",
1114
+ booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
1115
+ month = "11",
1116
+ year = "2019",
1117
+ publisher = "Association for Computational Linguistics",
1118
+ url = "https://arxiv.org/abs/1908.10084",
1119
+ }
1120
+ ```
1121
+
1122
+ #### MatryoshkaLoss
1123
+ ```bibtex
1124
+ @misc{kusupati2024matryoshka,
1125
+ title={Matryoshka Representation Learning},
1126
+ author={Aditya Kusupati and Gantavya Bhatt and Aniket Rege and Matthew Wallingford and Aditya Sinha and Vivek Ramanujan and William Howard-Snyder and Kaifeng Chen and Sham Kakade and Prateek Jain and Ali Farhadi},
1127
+ year={2024},
1128
+ eprint={2205.13147},
1129
+ archivePrefix={arXiv},
1130
+ primaryClass={cs.LG}
1131
+ }
1132
+ ```
1133
+
1134
+ #### MultipleNegativesRankingLoss
1135
+ ```bibtex
1136
+ @misc{henderson2017efficient,
1137
+ title={Efficient Natural Language Response Suggestion for Smart Reply},
1138
+ author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
1139
+ year={2017},
1140
+ eprint={1705.00652},
1141
+ archivePrefix={arXiv},
1142
+ primaryClass={cs.CL}
1143
+ }
1144
+ ```
1145
+
1146
+ <!--
1147
+ ## Glossary
1148
+
1149
+ *Clearly define terms in order to be accessible across audiences.*
1150
+ -->
1151
+
1152
+ <!--
1153
+ ## Model Card Authors
1154
+
1155
+ *Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
1156
+ -->
1157
+
1158
+ <!--
1159
+ ## Model Card Contact
1160
+
1161
+ *Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
1162
+ -->
config.json ADDED
@@ -0,0 +1,28 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "_name_or_path": "littlejohn-ai/bge-m3-spa-law-qa",
3
+ "architectures": [
4
+ "XLMRobertaModel"
5
+ ],
6
+ "attention_probs_dropout_prob": 0.1,
7
+ "bos_token_id": 0,
8
+ "classifier_dropout": null,
9
+ "eos_token_id": 2,
10
+ "hidden_act": "gelu",
11
+ "hidden_dropout_prob": 0.1,
12
+ "hidden_size": 1024,
13
+ "initializer_range": 0.02,
14
+ "intermediate_size": 4096,
15
+ "layer_norm_eps": 1e-05,
16
+ "max_position_embeddings": 8194,
17
+ "model_type": "xlm-roberta",
18
+ "num_attention_heads": 16,
19
+ "num_hidden_layers": 24,
20
+ "output_past": true,
21
+ "pad_token_id": 1,
22
+ "position_embedding_type": "absolute",
23
+ "torch_dtype": "float32",
24
+ "transformers_version": "4.46.2",
25
+ "type_vocab_size": 1,
26
+ "use_cache": true,
27
+ "vocab_size": 250002
28
+ }
config_sentence_transformers.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "__version__": {
3
+ "sentence_transformers": "3.3.0",
4
+ "transformers": "4.46.2",
5
+ "pytorch": "2.2.2"
6
+ },
7
+ "prompts": {},
8
+ "default_prompt_name": null,
9
+ "similarity_fn_name": "cosine"
10
+ }
model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:3919aeda5ede6cb860b8efcb9d7032b5af0a5c9c36e255de130fe9502023e857
3
+ size 2271064456
modules.json ADDED
@@ -0,0 +1,20 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "idx": 0,
4
+ "name": "0",
5
+ "path": "",
6
+ "type": "sentence_transformers.models.Transformer"
7
+ },
8
+ {
9
+ "idx": 1,
10
+ "name": "1",
11
+ "path": "1_Pooling",
12
+ "type": "sentence_transformers.models.Pooling"
13
+ },
14
+ {
15
+ "idx": 2,
16
+ "name": "2",
17
+ "path": "2_Normalize",
18
+ "type": "sentence_transformers.models.Normalize"
19
+ }
20
+ ]
sentence_bert_config.json ADDED
@@ -0,0 +1,4 @@
 
 
 
 
 
1
+ {
2
+ "max_seq_length": 8192,
3
+ "do_lower_case": false
4
+ }
special_tokens_map.json ADDED
@@ -0,0 +1,51 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "bos_token": {
3
+ "content": "<s>",
4
+ "lstrip": false,
5
+ "normalized": false,
6
+ "rstrip": false,
7
+ "single_word": false
8
+ },
9
+ "cls_token": {
10
+ "content": "<s>",
11
+ "lstrip": false,
12
+ "normalized": false,
13
+ "rstrip": false,
14
+ "single_word": false
15
+ },
16
+ "eos_token": {
17
+ "content": "</s>",
18
+ "lstrip": false,
19
+ "normalized": false,
20
+ "rstrip": false,
21
+ "single_word": false
22
+ },
23
+ "mask_token": {
24
+ "content": "<mask>",
25
+ "lstrip": true,
26
+ "normalized": false,
27
+ "rstrip": false,
28
+ "single_word": false
29
+ },
30
+ "pad_token": {
31
+ "content": "<pad>",
32
+ "lstrip": false,
33
+ "normalized": false,
34
+ "rstrip": false,
35
+ "single_word": false
36
+ },
37
+ "sep_token": {
38
+ "content": "</s>",
39
+ "lstrip": false,
40
+ "normalized": false,
41
+ "rstrip": false,
42
+ "single_word": false
43
+ },
44
+ "unk_token": {
45
+ "content": "<unk>",
46
+ "lstrip": false,
47
+ "normalized": false,
48
+ "rstrip": false,
49
+ "single_word": false
50
+ }
51
+ }
tokenizer.json ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:e4f7e21bec3fb0044ca0bb2d50eb5d4d8c596273c422baef84466d2c73748b9c
3
+ size 17083053
tokenizer_config.json ADDED
@@ -0,0 +1,62 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "added_tokens_decoder": {
3
+ "0": {
4
+ "content": "<s>",
5
+ "lstrip": false,
6
+ "normalized": false,
7
+ "rstrip": false,
8
+ "single_word": false,
9
+ "special": true
10
+ },
11
+ "1": {
12
+ "content": "<pad>",
13
+ "lstrip": false,
14
+ "normalized": false,
15
+ "rstrip": false,
16
+ "single_word": false,
17
+ "special": true
18
+ },
19
+ "2": {
20
+ "content": "</s>",
21
+ "lstrip": false,
22
+ "normalized": false,
23
+ "rstrip": false,
24
+ "single_word": false,
25
+ "special": true
26
+ },
27
+ "3": {
28
+ "content": "<unk>",
29
+ "lstrip": false,
30
+ "normalized": false,
31
+ "rstrip": false,
32
+ "single_word": false,
33
+ "special": true
34
+ },
35
+ "250001": {
36
+ "content": "<mask>",
37
+ "lstrip": true,
38
+ "normalized": false,
39
+ "rstrip": false,
40
+ "single_word": false,
41
+ "special": true
42
+ }
43
+ },
44
+ "bos_token": "<s>",
45
+ "clean_up_tokenization_spaces": true,
46
+ "cls_token": "<s>",
47
+ "eos_token": "</s>",
48
+ "mask_token": "<mask>",
49
+ "max_length": 8192,
50
+ "model_max_length": 8192,
51
+ "pad_to_multiple_of": null,
52
+ "pad_token": "<pad>",
53
+ "pad_token_type_id": 0,
54
+ "padding_side": "right",
55
+ "sep_token": "</s>",
56
+ "sp_model_kwargs": {},
57
+ "stride": 0,
58
+ "tokenizer_class": "XLMRobertaTokenizer",
59
+ "truncation_side": "right",
60
+ "truncation_strategy": "longest_first",
61
+ "unk_token": "<unk>"
62
+ }