File size: 30,760 Bytes
0aaadc4
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
---
language: []
library_name: sentence-transformers
tags:
- sentence-transformers
- sentence-similarity
- feature-extraction
- dataset_size:10K<n<100K
- loss:ContrastiveLoss
widget:
- source_sentence: ' O projeto de lei visa alterar o art. 1.788 do Código Civil para
    normatizar a sucessão de bens e contas digitais do autor da herança de qualidade
    patrimonial. O projeto pretende tratar do tema relevante e atual de herança digital,
    que tem sido objeto de diversos casos no Judiciário, e estabelecer medidas para
    a pacificação de conflitos sociais.'
  sentences:
  - ' O Projeto Lei visa corrigir a injustiça que prevê a impenhorabilidade do único
    imóvel residencial de casal entidade familiar, tornando-o sujeito a penhora para
    satisfazer dívidas contraídas com o locatário. A Lei estabelece que a impenhorabilidade
    se aplica somente à dívida civil, comercial e fiscal previdenciária, e não às
    obrigações decorrentes de contratos de locação. Além disso, a Lei garantiza o
    direito da família fiador de ser informada sobre a penhora do imóvel e de ter
    o direito de ser ouvida na decisão da execução.'
  - ' O projeto de lei nº 2008, do deputado Ratinho Junior, tem como objetivo extinguir
    a fiança aval prestado por pessoas naturais. A proposta visa eliminar a figura
    do avalista fiador, que tem sido motivo de ruína para milhões de famílias, e reduzir
    custos transações comerciais. A justificação da proposta é que a inclusão de pessoas
    físicas como fiadores é praticamente compulsória e pode levar a prejuízos inocentes.
    A proposta também busca aumentar a segurança transações e possibilitar a redução
    de custos para os credores.'
  - ' O projeto de lei visa reverter as alterações introduzidas pela Reforma Trabalhista
    de 2017, que afastaram as gestantes e lactantes de quaisquer atividades insalubres,
    e estabelecer a obrigação de conceder um descanso de 15 minutos entre o fim do
    horário normal e o início do período de cumprimento de horas extras. Além disso,
    o projeto busca preservar o direito das trabalhadoras à proteção integral do nascituro
    e da criança, à saúde e ao meio ambiente de trabalho saudável.'
- source_sentence: ' O projeto de lei visa alterar o artigo 45 da Lei nº 8.080, de
    19 de setembro de 1990, para permitir o atendimento de serviços saúde para os
    soldados da Borracha que participaram da Segunda Guerra Mundial, e seus familiares
    dependentes. O projeto também busca reconhecer o esforço e dedicação dos brasileiros
    que lutaram na guerra.'
  sentences:
  - ' A deputada Perpétua Almeida apresentou um projeto de lei que reconhece os seringueiros
    soldados borracha que participaram da 2ª Guerra Mundial. O projeto define que
    esses heróis brasileiros merecem tratamento verdadeiros heróis e devem ser incluídos
    no Livro Heróis Pátria. O projeto também estabelece que os descendentes dos seringueiros
    soldados borracha devem ser incluídos no registro de heróis. O projeto foi apresentado
    na Câmara dos Deputados em 2009.'
  - ' A Lei nº 11.199/2009, sancionada em 4 de maio de 2009, estabelece a regulamentação
    da educação superior no Brasil. A lei define a autonomia universitária, o financiamento
    da educação superior, a assistência estudantil, a extensão e a pesquisa, entre
    outros aspectos. Além disso, a lei estabelece a criação de fundos para a finança
    da educação superior e a obrigatoriedade da realização de exames para ingresso
    nas universidades. A lei também prevê a criação de polos tecnológicos e a ampliação
    do ensino profissional e técnico.'
  - ' O projeto de lei nº 4329/2021, apresentado pelo deputado federal Luciano Ducci,
    visa restringir o uso de cigarros eletrônicos e narguilés em recintos coletivos
    fechados. A proposta busca inibir o consumo desses produtos, que podem ser prejudiciais
    à saúde, especialmente para o público jovem. A justificativa é que o Brasil tem
    sido um dos países mais bem-sucedidos na redução do tabagismo, mas a indústria
    do tabaco tem encontrado artifícios para driblar as restrições. O projeto busca
    submeter os cigarros eletrônicos e narguilés às mesmas restrições aplicadas aos
    demais produtos fumígenos.'
- source_sentence: ' O projeto de lei visa permitir que os contribuintes deduzam das
    receitas tributáveis as despesas realizadas com matrículas e mensalidades de cursos
    de idiomas estrangeiros, com o objetivo de incentivar a educação e o desenvolvimento
    profissional. A proposta foi apresentada pelo deputado Fernando Coruja e está
    sendo discutida no Congresso Nacional.'
  sentences:
  - ' O projeto de lei nº 2016, de 2016, proposto pelo deputado Aureo, permite a dedução
    de pagamentos relativos a despesas com cursos de idiomas estrangeiros para apuração
    do imposto sobre a renda das pessoas físicas. A justificativa para a proposta
    é que a rede pública de ensino não é capaz de dotar os brasileiros das habilidades
    necessárias para dominar um idioma estrangeiro, e que a dedução deveria incentivar
    o custeio dos cursos realizados em escolas privadas. O projeto prevê a dedução
    de despesas com cursos de idiomas estrangeiros até o limite anual individual de
    NR$ 2.000,00.'
  - ' O projeto de lei visa regular o cancelamento de bilhetes aéreos de ida e volta
    em caso de não comparecimento do passageiro para embarque, garantindo a validade
    e exequibilidade do trecho de retorno. A proposta estabelece uma limitação de
    50% do valor adimplido pelos passageiros para taxas de cancelamento e remarcação,
    e prevê punições para descumprimento da lei. A proposta busca proteger os consumidores
    e garantir a equidade nas relações comerciais entre os prestadores de serviços
    de transporte aéreo e os passageiros.'
  - ' A Lei nº 10.452/2006, aprovada pelo Congresso Nacional em 2006, alterou o art.
    193 da Consolidação das Leis do Trabalho (CLT) para considerar as atividades de
    carteiros como operações perigosas, regulamentadas pelo Ministério do Trabalho
    e Emprego. Essa alteração entrou em vigor em julho de 2006, após a publicação
    no Senado Federal. A lei estabelece que as atividades de carteiros exercidas em
    condições de risco à integridade física do trabalhador, decorrência da circulação
    de vias públicas perigosas e entrega de correspondência em comum, são consideradas
    operações perigosas.'
- source_sentence: ' O projeto de lei visa extinguir as enfiteuses existentes e modernizar
    a legislação civil brasileira, permitindo a transferência do domínio útil e a
    cessão do senhorio, e estabelecendo novos parâmetros jurídicos para o instituto
    da enfiteuse. A lei também regulamenta a terrenos marinha e estabelece novos critérios
    para a definição desses terrenos.'
  sentences:
  - ' O projeto de lei nº 2010, do deputado Ricardo Tripoli, objetiva extinção da
    cobrança de laudêmio em transmissões aforadas, com base na justificativa de que
    o instituto da enfiteuse não é mais necessário e que a cobrança do laudêmio é
    uma onera que não corresponde à realidade, pois o proprietário da propriedade
    already possui o domínio útil e direto. Além disso, o projeto também propõe a
    extinção da cobrança de laudêmio em caso de doação, desapropriação e herança,
    com o objetivo de aperfeiçoar o ordenamento jurídico em relação a essas transações.'
  - ' O projeto de lei proposto por Laerte Bessa, PMDB-DF, visa regulamentar a jornada
    de trabalho de profissionais de saúde, estabelecendo um limite de 80 horas semanais
    para esses profissionários. A proposta é baseada na Constituição e na necessidade
    de garantir a qualidade do trabalho e a dignidade dos profissionais de saúde,
    que atualmente enfrentam demandas exageradas e desumanas. A medida busca evitar
    a contratação de servidores empregados em horários extras e rotineiros, garantindo
    o respeito ao limite de jornada semanal.'
  - ' O projeto de lei apresentado por Raul Henry em 2007 visa estabelecer um prazo
    para a proibição da produção, comercialização e utilização de pilhas recarregáveis,
    com o objetivo de evitar a contaminação causada por esses resíduos perigosos.
    A proposta estabelece penalidades para quem não cumpriser as normas ambientais
    e propõe educativas medidas para o descarte correto dos materiais tóxicos. A iniciativa
    busca melhorar o equilíbrio ecológico do planeta e reduzir o prejuízo ecológico
    causado pela utilização de pilhas recarregáveis.'
- source_sentence: ' O projeto de lei visa alterar o art. 20 da Lei nº 5.474/68, permitindo
    que as empresas locadoras de bens móveis emitam faturas duplicatas para representar
    créditos oriundos de contratos de locação de bens móveis. A proposta tem como
    objetivo regularizar a prática comercial usual e evitar futuros questionamentos
    no Poder Judiciário.'
  sentences:
  - ' A proposta de lei visa permitir a emissão de fatura e duplicata a partir da
    locação de bens móveis, além de estabelecer que a locação de bens móveis não se
    equipara à prestação de serviços. A justificativa é que a emissão de duplicata
    é necessária para a adequada administração financeira das empresas e para viabilizar
    o desconto do título de crédito por meio do sistema bancário. Além disso, a proposta
    de lei não alterará o art. 26 da Lei nº 5.474, de 1968, que estabeleceu a nova
    redação do Código Penal.'
  - ' O Projeto de Lei apresentado pelo Deputado Cabo Júlio estabelece normas para
    o atendimento de vítimas de violência sexual em hospitais públicos e privados,
    obrigando a notificação compulsória e o registro de dados identificados das vítimas.
    A proposta busca garantir o direito à saúde e à dignidade das vítimas, além de
    combater a impunidade e a omissão de responsabilidades por parte das autoridades.
    A medida também pretende incentivar a prevenção da violência sexual e a identificação
    e condicionamento de agressores.'
  - ' O projeto de lei proíbe a venda de refrigerantes a menores de quatorze anos,
    por serem prejudiciais à saúde. A justificativa é que os refrigerantes não têm
    valor nutricional, são fontes de açúcar e podem causar obesidade, cáries dentárias
    e irritação na mucosa digestiva. Além disso, as versões dietéticas têm edulcorantes
    de segurança duvidosa. O projeto visa proteger as crianças de tais efeitos prejudiciais
    e criar novas gerações mais saudáveis.'
pipeline_tag: sentence-similarity
---

# SentenceTransformer

This is a [sentence-transformers](https://www.SBERT.net) model trained. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.

## Model Details

### Model Description
- **Model Type:** Sentence Transformer
<!-- - **Base model:** [Unknown](https://huggingface.co/unknown) -->
- **Maximum Sequence Length:** 512 tokens
- **Output Dimensionality:** 768 tokens
- **Similarity Function:** Cosine Similarity
<!-- - **Training Dataset:** Unknown -->
<!-- - **Language:** Unknown -->
<!-- - **License:** Unknown -->

### Model Sources

- **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
- **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
- **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)

### Full Model Architecture

```
SentenceTransformer(
  (0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: BertModel 
  (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
)
```

## Usage

### Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

```bash
pip install -U sentence-transformers
```

Then you can load this model and run inference.
```python
from sentence_transformers import SentenceTransformer

# Download from the 🤗 Hub
model = SentenceTransformer("josedossantos/urf-summary-legalbert")
# Run inference
sentences = [
    ' O projeto de lei visa alterar o art. 20 da Lei nº 5.474/68, permitindo que as empresas locadoras de bens móveis emitam faturas duplicatas para representar créditos oriundos de contratos de locação de bens móveis. A proposta tem como objetivo regularizar a prática comercial usual e evitar futuros questionamentos no Poder Judiciário.',
    ' A proposta de lei visa permitir a emissão de fatura e duplicata a partir da locação de bens móveis, além de estabelecer que a locação de bens móveis não se equipara à prestação de serviços. A justificativa é que a emissão de duplicata é necessária para a adequada administração financeira das empresas e para viabilizar o desconto do título de crédito por meio do sistema bancário. Além disso, a proposta de lei não alterará o art. 26 da Lei nº 5.474, de 1968, que estabeleceu a nova redação do Código Penal.',
    ' O Projeto de Lei apresentado pelo Deputado Cabo Júlio estabelece normas para o atendimento de vítimas de violência sexual em hospitais públicos e privados, obrigando a notificação compulsória e o registro de dados identificados das vítimas. A proposta busca garantir o direito à saúde e à dignidade das vítimas, além de combater a impunidade e a omissão de responsabilidades por parte das autoridades. A medida também pretende incentivar a prevenção da violência sexual e a identificação e condicionamento de agressores.',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]

# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
```

<!--
### Direct Usage (Transformers)

<details><summary>Click to see the direct usage in Transformers</summary>

</details>
-->

<!--
### Downstream Usage (Sentence Transformers)

You can finetune this model on your own dataset.

<details><summary>Click to expand</summary>

</details>
-->

<!--
### Out-of-Scope Use

*List how the model may foreseeably be misused and address what users ought not to do with the model.*
-->

<!--
## Bias, Risks and Limitations

*What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
-->

<!--
### Recommendations

*What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
-->

## Training Details

### Training Dataset

#### Unnamed Dataset


* Size: 10,962 training samples
* Columns: <code>sentence_0</code>, <code>sentence_1</code>, and <code>label</code>
* Approximate statistics based on the first 1000 samples:
  |         | sentence_0                                                                           | sentence_1                                                                           | label                                           |
  |:--------|:-------------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|:------------------------------------------------|
  | type    | string                                                                               | string                                                                               | int                                             |
  | details | <ul><li>min: 49 tokens</li><li>mean: 141.66 tokens</li><li>max: 344 tokens</li></ul> | <ul><li>min: 36 tokens</li><li>mean: 140.06 tokens</li><li>max: 355 tokens</li></ul> | <ul><li>0: ~49.50%</li><li>1: ~50.50%</li></ul> |
* Samples:
  | sentence_0                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                       | sentence_1                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                 | label          |
  |:-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------|
  | <code> A Lei nº 152, de 2022, alterou a Lei nº 12.187, de 2009, estabelecendo novas metas de compromisso nacional voluntário para reduzir emissões de gases de efeito estufa até 2025 e 2030, em relação a 2005. Essas metas serão regulamentadas e depositadas junto à Convenção-Quadro das Nações Unidas sobre Mudança do Clima. A Lei também destaca a importância da eliminação do desmatamento ilegal e da promoção da agropecuária sustentável.</code>                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                     | <code> O projeto de lei estabelece preferência no desempate de processo licitatório para empresas que comprovem mitigação à mudança do clima. A proposta inclui a inserção de inciso VI ao § 2º do art. 3º da Lei nº 8.666, de 21 de junho de 1993, que regulamenta o art. 37, inciso XXI, da Constituição Federal, e dá outras providências. A mitigação ambiental é entendida como mudanças e substituições tecnológicas que reduzam o uso de recursos e as emissões por unidade de produção, bem como a implementação de medidas que reduzam as emissões de gases de efeito estufa e aumentem os sumidouros. A proposta busca contribuir para o combate ao aquecimento global e à poluição ambiental, sem resultar em prejuízos ao Poder Público ou à sociedade.</code> | <code>0</code> |
  | <code> O projeto de lei visa estabelecer normas para a inserção de contratos honorários em causas criminais, obrigando os advogados a comprovar a origem lícita dos recursos utilizados e a identificar o caso pessoa responsável. A lei busca prevenir o uso de dinheiro sujo em pagamentos honorários e contribuição para a administração da justiça.</code>                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                   | <code> O projeto de lei visa obrigar os réus de crimes hediondos e organizações criminosas a demonstrar a origem lícita dos recursos financeiros usados para pagar honorários de advogados. A proposta busca salvaguardar a profissão honesta e transparente, evitando que os advogados sejam usados para lavar dinheiro de atividades criminosas. O projeto também prevê a possibilidade de um juiz verificar indícios de fraude e comunicação com o Conselho Controle Atividades Financeiras.</code>                                                                                                                                                                                                                                                                     | <code>1</code> |
  | <code> O presente projeto de lei institui o Estatuto do Carbono Verde, regulamentando o mercado de carbono no âmbito dos povos tradicionais e do agronegócio, com foco em reduzir as emissões de gases de efeito estufa e promover o desenvolvimento sustentável. A proposta traz novas medidas, como a criação da Secretaria Especial do Carbono Verde, o Programa Nacional Obrigatória de Compensão de Emissões de GEE e o Plano Nacional Agrícola de Redução das Emissões de GEE. Além disso, a proposta estabelece a comercialização de créditos de carbono nos mercados obrigatórios, permitindo a inclusão de povos tradicionais e comunidades tradicionais na comercialização dos créditos.<br>     O presente projeto de lei é uma iniciativa inovante para o desenvolvimento sustentável do país, garantindo o direito dos povos tradicionais e comunidades tradicionais a participar no mercado obrigatória de carbono verde mercado. Apresenta a proposto de lei nº 121218/20009, de 20009/201</code> | <code> A proposta de lei visa estabelecer incentivos fiscais para pessoas físicas e jurídicas que investem em projetos de desenvolvimento limpo, como o mercado de reduções certificadas de emissões (RCEs). O projeto prevê a criação de fundos de investimento para financiar esses projetos e a regulamentação da Comissão de Valores Mobiliários. A lei também estabelece que as quotas do Fundo de Investimento em Projetos de Desenvolvimento Limpo (FIMDL) serão isentas de imposto de renda e outras taxas. Além disso, a lei prevê a compensação de prejuízos para investidores residentes e domiciliados no exterior que venham a sofrer prejuízos decorrentes da alienação de quotas do FIMDL.</code>                                                           | <code>0</code> |
* Loss: [<code>ContrastiveLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#contrastiveloss) with these parameters:
  ```json
  {
      "distance_metric": "SiameseDistanceMetric.COSINE_DISTANCE",
      "margin": 0.5,
      "size_average": true
  }
  ```

### Training Hyperparameters
#### Non-Default Hyperparameters

- `per_device_train_batch_size`: 2
- `per_device_eval_batch_size`: 2
- `num_train_epochs`: 1
- `multi_dataset_batch_sampler`: round_robin

#### All Hyperparameters
<details><summary>Click to expand</summary>

- `overwrite_output_dir`: False
- `do_predict`: False
- `prediction_loss_only`: True
- `per_device_train_batch_size`: 2
- `per_device_eval_batch_size`: 2
- `per_gpu_train_batch_size`: None
- `per_gpu_eval_batch_size`: None
- `gradient_accumulation_steps`: 1
- `eval_accumulation_steps`: None
- `learning_rate`: 5e-05
- `weight_decay`: 0.0
- `adam_beta1`: 0.9
- `adam_beta2`: 0.999
- `adam_epsilon`: 1e-08
- `max_grad_norm`: 1
- `num_train_epochs`: 1
- `max_steps`: -1
- `lr_scheduler_type`: linear
- `lr_scheduler_kwargs`: {}
- `warmup_ratio`: 0.0
- `warmup_steps`: 0
- `log_level`: passive
- `log_level_replica`: warning
- `log_on_each_node`: True
- `logging_nan_inf_filter`: True
- `save_safetensors`: True
- `save_on_each_node`: False
- `save_only_model`: False
- `no_cuda`: False
- `use_cpu`: False
- `use_mps_device`: False
- `seed`: 42
- `data_seed`: None
- `jit_mode_eval`: False
- `use_ipex`: False
- `bf16`: False
- `fp16`: False
- `fp16_opt_level`: O1
- `half_precision_backend`: auto
- `bf16_full_eval`: False
- `fp16_full_eval`: False
- `tf32`: None
- `local_rank`: 0
- `ddp_backend`: None
- `tpu_num_cores`: None
- `tpu_metrics_debug`: False
- `debug`: []
- `dataloader_drop_last`: False
- `dataloader_num_workers`: 0
- `dataloader_prefetch_factor`: None
- `past_index`: -1
- `disable_tqdm`: False
- `remove_unused_columns`: True
- `label_names`: None
- `load_best_model_at_end`: False
- `ignore_data_skip`: False
- `fsdp`: []
- `fsdp_min_num_params`: 0
- `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
- `fsdp_transformer_layer_cls_to_wrap`: None
- `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True}
- `deepspeed`: None
- `label_smoothing_factor`: 0.0
- `optim`: adamw_torch
- `optim_args`: None
- `adafactor`: False
- `group_by_length`: False
- `length_column_name`: length
- `ddp_find_unused_parameters`: None
- `ddp_bucket_cap_mb`: None
- `ddp_broadcast_buffers`: False
- `dataloader_pin_memory`: True
- `dataloader_persistent_workers`: False
- `skip_memory_metrics`: True
- `use_legacy_prediction_loop`: False
- `push_to_hub`: False
- `resume_from_checkpoint`: None
- `hub_model_id`: None
- `hub_strategy`: every_save
- `hub_private_repo`: False
- `hub_always_push`: False
- `gradient_checkpointing`: False
- `gradient_checkpointing_kwargs`: None
- `include_inputs_for_metrics`: False
- `fp16_backend`: auto
- `push_to_hub_model_id`: None
- `push_to_hub_organization`: None
- `mp_parameters`: 
- `auto_find_batch_size`: False
- `full_determinism`: False
- `torchdynamo`: None
- `ray_scope`: last
- `ddp_timeout`: 1800
- `torch_compile`: False
- `torch_compile_backend`: None
- `torch_compile_mode`: None
- `dispatch_batches`: None
- `split_batches`: None
- `include_tokens_per_second`: False
- `include_num_input_tokens_seen`: False
- `neftune_noise_alpha`: None
- `optim_target_modules`: None
- `batch_sampler`: batch_sampler
- `multi_dataset_batch_sampler`: round_robin

</details>

### Training Logs
| Epoch  | Step | Training Loss |
|:------:|:----:|:-------------:|
| 0.0912 | 500  | 0.0399        |
| 0.1824 | 1000 | 0.0263        |
| 0.2737 | 1500 | 0.0236        |
| 0.3649 | 2000 | 0.0217        |
| 0.4561 | 2500 | 0.0189        |
| 0.5473 | 3000 | 0.0179        |
| 0.6386 | 3500 | 0.0155        |
| 0.7298 | 4000 | 0.0137        |
| 0.8210 | 4500 | 0.011         |
| 0.9122 | 5000 | 0.0104        |


### Framework Versions
- Python: 3.10.14
- Sentence Transformers: 3.0.0
- Transformers: 4.39.3
- PyTorch: 2.2.0
- Accelerate: 0.30.1
- Datasets: 2.14.4
- Tokenizers: 0.15.1

## Citation

### BibTeX

#### Sentence Transformers
```bibtex
@inproceedings{reimers-2019-sentence-bert,
    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
    author = "Reimers, Nils and Gurevych, Iryna",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
    month = "11",
    year = "2019",
    publisher = "Association for Computational Linguistics",
    url = "https://arxiv.org/abs/1908.10084",
}
```

#### ContrastiveLoss
```bibtex
@inproceedings{hadsell2006dimensionality,
    author={Hadsell, R. and Chopra, S. and LeCun, Y.},
    booktitle={2006 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR'06)}, 
    title={Dimensionality Reduction by Learning an Invariant Mapping}, 
    year={2006},
    volume={2},
    number={},
    pages={1735-1742},
    doi={10.1109/CVPR.2006.100}
}
```

<!--
## Glossary

*Clearly define terms in order to be accessible across audiences.*
-->

<!--
## Model Card Authors

*Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
-->

<!--
## Model Card Contact

*Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
-->