File size: 30,760 Bytes
0aaadc4 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 280 281 282 283 284 285 286 287 288 289 290 291 292 293 294 295 296 297 298 299 300 301 302 303 304 305 306 307 308 309 310 311 312 313 314 315 316 317 318 319 320 321 322 323 324 325 326 327 328 329 330 331 332 333 334 335 336 337 338 339 340 341 342 343 344 345 346 347 348 349 350 351 352 353 354 355 356 357 358 359 360 361 362 363 364 365 366 367 368 369 370 371 372 373 374 375 376 377 378 379 380 381 382 383 384 385 386 387 388 389 390 391 392 393 394 395 396 397 398 399 400 401 402 403 404 405 406 407 408 409 410 411 412 413 414 415 416 417 418 419 420 421 422 423 424 425 426 427 428 429 430 431 432 433 434 435 436 437 438 439 440 441 442 443 444 445 446 447 448 449 450 451 452 453 454 455 456 457 458 459 460 461 462 463 464 465 466 |
---
language: []
library_name: sentence-transformers
tags:
- sentence-transformers
- sentence-similarity
- feature-extraction
- dataset_size:10K<n<100K
- loss:ContrastiveLoss
widget:
- source_sentence: ' O projeto de lei visa alterar o art. 1.788 do Código Civil para
normatizar a sucessão de bens e contas digitais do autor da herança de qualidade
patrimonial. O projeto pretende tratar do tema relevante e atual de herança digital,
que tem sido objeto de diversos casos no Judiciário, e estabelecer medidas para
a pacificação de conflitos sociais.'
sentences:
- ' O Projeto Lei visa corrigir a injustiça que prevê a impenhorabilidade do único
imóvel residencial de casal entidade familiar, tornando-o sujeito a penhora para
satisfazer dívidas contraídas com o locatário. A Lei estabelece que a impenhorabilidade
se aplica somente à dívida civil, comercial e fiscal previdenciária, e não às
obrigações decorrentes de contratos de locação. Além disso, a Lei garantiza o
direito da família fiador de ser informada sobre a penhora do imóvel e de ter
o direito de ser ouvida na decisão da execução.'
- ' O projeto de lei nº 2008, do deputado Ratinho Junior, tem como objetivo extinguir
a fiança aval prestado por pessoas naturais. A proposta visa eliminar a figura
do avalista fiador, que tem sido motivo de ruína para milhões de famílias, e reduzir
custos transações comerciais. A justificação da proposta é que a inclusão de pessoas
físicas como fiadores é praticamente compulsória e pode levar a prejuízos inocentes.
A proposta também busca aumentar a segurança transações e possibilitar a redução
de custos para os credores.'
- ' O projeto de lei visa reverter as alterações introduzidas pela Reforma Trabalhista
de 2017, que afastaram as gestantes e lactantes de quaisquer atividades insalubres,
e estabelecer a obrigação de conceder um descanso de 15 minutos entre o fim do
horário normal e o início do período de cumprimento de horas extras. Além disso,
o projeto busca preservar o direito das trabalhadoras à proteção integral do nascituro
e da criança, à saúde e ao meio ambiente de trabalho saudável.'
- source_sentence: ' O projeto de lei visa alterar o artigo 45 da Lei nº 8.080, de
19 de setembro de 1990, para permitir o atendimento de serviços saúde para os
soldados da Borracha que participaram da Segunda Guerra Mundial, e seus familiares
dependentes. O projeto também busca reconhecer o esforço e dedicação dos brasileiros
que lutaram na guerra.'
sentences:
- ' A deputada Perpétua Almeida apresentou um projeto de lei que reconhece os seringueiros
soldados borracha que participaram da 2ª Guerra Mundial. O projeto define que
esses heróis brasileiros merecem tratamento verdadeiros heróis e devem ser incluídos
no Livro Heróis Pátria. O projeto também estabelece que os descendentes dos seringueiros
soldados borracha devem ser incluídos no registro de heróis. O projeto foi apresentado
na Câmara dos Deputados em 2009.'
- ' A Lei nº 11.199/2009, sancionada em 4 de maio de 2009, estabelece a regulamentação
da educação superior no Brasil. A lei define a autonomia universitária, o financiamento
da educação superior, a assistência estudantil, a extensão e a pesquisa, entre
outros aspectos. Além disso, a lei estabelece a criação de fundos para a finança
da educação superior e a obrigatoriedade da realização de exames para ingresso
nas universidades. A lei também prevê a criação de polos tecnológicos e a ampliação
do ensino profissional e técnico.'
- ' O projeto de lei nº 4329/2021, apresentado pelo deputado federal Luciano Ducci,
visa restringir o uso de cigarros eletrônicos e narguilés em recintos coletivos
fechados. A proposta busca inibir o consumo desses produtos, que podem ser prejudiciais
à saúde, especialmente para o público jovem. A justificativa é que o Brasil tem
sido um dos países mais bem-sucedidos na redução do tabagismo, mas a indústria
do tabaco tem encontrado artifícios para driblar as restrições. O projeto busca
submeter os cigarros eletrônicos e narguilés às mesmas restrições aplicadas aos
demais produtos fumígenos.'
- source_sentence: ' O projeto de lei visa permitir que os contribuintes deduzam das
receitas tributáveis as despesas realizadas com matrículas e mensalidades de cursos
de idiomas estrangeiros, com o objetivo de incentivar a educação e o desenvolvimento
profissional. A proposta foi apresentada pelo deputado Fernando Coruja e está
sendo discutida no Congresso Nacional.'
sentences:
- ' O projeto de lei nº 2016, de 2016, proposto pelo deputado Aureo, permite a dedução
de pagamentos relativos a despesas com cursos de idiomas estrangeiros para apuração
do imposto sobre a renda das pessoas físicas. A justificativa para a proposta
é que a rede pública de ensino não é capaz de dotar os brasileiros das habilidades
necessárias para dominar um idioma estrangeiro, e que a dedução deveria incentivar
o custeio dos cursos realizados em escolas privadas. O projeto prevê a dedução
de despesas com cursos de idiomas estrangeiros até o limite anual individual de
NR$ 2.000,00.'
- ' O projeto de lei visa regular o cancelamento de bilhetes aéreos de ida e volta
em caso de não comparecimento do passageiro para embarque, garantindo a validade
e exequibilidade do trecho de retorno. A proposta estabelece uma limitação de
50% do valor adimplido pelos passageiros para taxas de cancelamento e remarcação,
e prevê punições para descumprimento da lei. A proposta busca proteger os consumidores
e garantir a equidade nas relações comerciais entre os prestadores de serviços
de transporte aéreo e os passageiros.'
- ' A Lei nº 10.452/2006, aprovada pelo Congresso Nacional em 2006, alterou o art.
193 da Consolidação das Leis do Trabalho (CLT) para considerar as atividades de
carteiros como operações perigosas, regulamentadas pelo Ministério do Trabalho
e Emprego. Essa alteração entrou em vigor em julho de 2006, após a publicação
no Senado Federal. A lei estabelece que as atividades de carteiros exercidas em
condições de risco à integridade física do trabalhador, decorrência da circulação
de vias públicas perigosas e entrega de correspondência em comum, são consideradas
operações perigosas.'
- source_sentence: ' O projeto de lei visa extinguir as enfiteuses existentes e modernizar
a legislação civil brasileira, permitindo a transferência do domínio útil e a
cessão do senhorio, e estabelecendo novos parâmetros jurídicos para o instituto
da enfiteuse. A lei também regulamenta a terrenos marinha e estabelece novos critérios
para a definição desses terrenos.'
sentences:
- ' O projeto de lei nº 2010, do deputado Ricardo Tripoli, objetiva extinção da
cobrança de laudêmio em transmissões aforadas, com base na justificativa de que
o instituto da enfiteuse não é mais necessário e que a cobrança do laudêmio é
uma onera que não corresponde à realidade, pois o proprietário da propriedade
already possui o domínio útil e direto. Além disso, o projeto também propõe a
extinção da cobrança de laudêmio em caso de doação, desapropriação e herança,
com o objetivo de aperfeiçoar o ordenamento jurídico em relação a essas transações.'
- ' O projeto de lei proposto por Laerte Bessa, PMDB-DF, visa regulamentar a jornada
de trabalho de profissionais de saúde, estabelecendo um limite de 80 horas semanais
para esses profissionários. A proposta é baseada na Constituição e na necessidade
de garantir a qualidade do trabalho e a dignidade dos profissionais de saúde,
que atualmente enfrentam demandas exageradas e desumanas. A medida busca evitar
a contratação de servidores empregados em horários extras e rotineiros, garantindo
o respeito ao limite de jornada semanal.'
- ' O projeto de lei apresentado por Raul Henry em 2007 visa estabelecer um prazo
para a proibição da produção, comercialização e utilização de pilhas recarregáveis,
com o objetivo de evitar a contaminação causada por esses resíduos perigosos.
A proposta estabelece penalidades para quem não cumpriser as normas ambientais
e propõe educativas medidas para o descarte correto dos materiais tóxicos. A iniciativa
busca melhorar o equilíbrio ecológico do planeta e reduzir o prejuízo ecológico
causado pela utilização de pilhas recarregáveis.'
- source_sentence: ' O projeto de lei visa alterar o art. 20 da Lei nº 5.474/68, permitindo
que as empresas locadoras de bens móveis emitam faturas duplicatas para representar
créditos oriundos de contratos de locação de bens móveis. A proposta tem como
objetivo regularizar a prática comercial usual e evitar futuros questionamentos
no Poder Judiciário.'
sentences:
- ' A proposta de lei visa permitir a emissão de fatura e duplicata a partir da
locação de bens móveis, além de estabelecer que a locação de bens móveis não se
equipara à prestação de serviços. A justificativa é que a emissão de duplicata
é necessária para a adequada administração financeira das empresas e para viabilizar
o desconto do título de crédito por meio do sistema bancário. Além disso, a proposta
de lei não alterará o art. 26 da Lei nº 5.474, de 1968, que estabeleceu a nova
redação do Código Penal.'
- ' O Projeto de Lei apresentado pelo Deputado Cabo Júlio estabelece normas para
o atendimento de vítimas de violência sexual em hospitais públicos e privados,
obrigando a notificação compulsória e o registro de dados identificados das vítimas.
A proposta busca garantir o direito à saúde e à dignidade das vítimas, além de
combater a impunidade e a omissão de responsabilidades por parte das autoridades.
A medida também pretende incentivar a prevenção da violência sexual e a identificação
e condicionamento de agressores.'
- ' O projeto de lei proíbe a venda de refrigerantes a menores de quatorze anos,
por serem prejudiciais à saúde. A justificativa é que os refrigerantes não têm
valor nutricional, são fontes de açúcar e podem causar obesidade, cáries dentárias
e irritação na mucosa digestiva. Além disso, as versões dietéticas têm edulcorantes
de segurança duvidosa. O projeto visa proteger as crianças de tais efeitos prejudiciais
e criar novas gerações mais saudáveis.'
pipeline_tag: sentence-similarity
---
# SentenceTransformer
This is a [sentence-transformers](https://www.SBERT.net) model trained. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
## Model Details
### Model Description
- **Model Type:** Sentence Transformer
<!-- - **Base model:** [Unknown](https://huggingface.co/unknown) -->
- **Maximum Sequence Length:** 512 tokens
- **Output Dimensionality:** 768 tokens
- **Similarity Function:** Cosine Similarity
<!-- - **Training Dataset:** Unknown -->
<!-- - **Language:** Unknown -->
<!-- - **License:** Unknown -->
### Model Sources
- **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
- **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
- **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
### Full Model Architecture
```
SentenceTransformer(
(0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: BertModel
(1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
)
```
## Usage
### Direct Usage (Sentence Transformers)
First install the Sentence Transformers library:
```bash
pip install -U sentence-transformers
```
Then you can load this model and run inference.
```python
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("josedossantos/urf-summary-legalbert")
# Run inference
sentences = [
' O projeto de lei visa alterar o art. 20 da Lei nº 5.474/68, permitindo que as empresas locadoras de bens móveis emitam faturas duplicatas para representar créditos oriundos de contratos de locação de bens móveis. A proposta tem como objetivo regularizar a prática comercial usual e evitar futuros questionamentos no Poder Judiciário.',
' A proposta de lei visa permitir a emissão de fatura e duplicata a partir da locação de bens móveis, além de estabelecer que a locação de bens móveis não se equipara à prestação de serviços. A justificativa é que a emissão de duplicata é necessária para a adequada administração financeira das empresas e para viabilizar o desconto do título de crédito por meio do sistema bancário. Além disso, a proposta de lei não alterará o art. 26 da Lei nº 5.474, de 1968, que estabeleceu a nova redação do Código Penal.',
' O Projeto de Lei apresentado pelo Deputado Cabo Júlio estabelece normas para o atendimento de vítimas de violência sexual em hospitais públicos e privados, obrigando a notificação compulsória e o registro de dados identificados das vítimas. A proposta busca garantir o direito à saúde e à dignidade das vítimas, além de combater a impunidade e a omissão de responsabilidades por parte das autoridades. A medida também pretende incentivar a prevenção da violência sexual e a identificação e condicionamento de agressores.',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]
# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
```
<!--
### Direct Usage (Transformers)
<details><summary>Click to see the direct usage in Transformers</summary>
</details>
-->
<!--
### Downstream Usage (Sentence Transformers)
You can finetune this model on your own dataset.
<details><summary>Click to expand</summary>
</details>
-->
<!--
### Out-of-Scope Use
*List how the model may foreseeably be misused and address what users ought not to do with the model.*
-->
<!--
## Bias, Risks and Limitations
*What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
-->
<!--
### Recommendations
*What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
-->
## Training Details
### Training Dataset
#### Unnamed Dataset
* Size: 10,962 training samples
* Columns: <code>sentence_0</code>, <code>sentence_1</code>, and <code>label</code>
* Approximate statistics based on the first 1000 samples:
| | sentence_0 | sentence_1 | label |
|:--------|:-------------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|:------------------------------------------------|
| type | string | string | int |
| details | <ul><li>min: 49 tokens</li><li>mean: 141.66 tokens</li><li>max: 344 tokens</li></ul> | <ul><li>min: 36 tokens</li><li>mean: 140.06 tokens</li><li>max: 355 tokens</li></ul> | <ul><li>0: ~49.50%</li><li>1: ~50.50%</li></ul> |
* Samples:
| sentence_0 | sentence_1 | label |
|:-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------|
| <code> A Lei nº 152, de 2022, alterou a Lei nº 12.187, de 2009, estabelecendo novas metas de compromisso nacional voluntário para reduzir emissões de gases de efeito estufa até 2025 e 2030, em relação a 2005. Essas metas serão regulamentadas e depositadas junto à Convenção-Quadro das Nações Unidas sobre Mudança do Clima. A Lei também destaca a importância da eliminação do desmatamento ilegal e da promoção da agropecuária sustentável.</code> | <code> O projeto de lei estabelece preferência no desempate de processo licitatório para empresas que comprovem mitigação à mudança do clima. A proposta inclui a inserção de inciso VI ao § 2º do art. 3º da Lei nº 8.666, de 21 de junho de 1993, que regulamenta o art. 37, inciso XXI, da Constituição Federal, e dá outras providências. A mitigação ambiental é entendida como mudanças e substituições tecnológicas que reduzam o uso de recursos e as emissões por unidade de produção, bem como a implementação de medidas que reduzam as emissões de gases de efeito estufa e aumentem os sumidouros. A proposta busca contribuir para o combate ao aquecimento global e à poluição ambiental, sem resultar em prejuízos ao Poder Público ou à sociedade.</code> | <code>0</code> |
| <code> O projeto de lei visa estabelecer normas para a inserção de contratos honorários em causas criminais, obrigando os advogados a comprovar a origem lícita dos recursos utilizados e a identificar o caso pessoa responsável. A lei busca prevenir o uso de dinheiro sujo em pagamentos honorários e contribuição para a administração da justiça.</code> | <code> O projeto de lei visa obrigar os réus de crimes hediondos e organizações criminosas a demonstrar a origem lícita dos recursos financeiros usados para pagar honorários de advogados. A proposta busca salvaguardar a profissão honesta e transparente, evitando que os advogados sejam usados para lavar dinheiro de atividades criminosas. O projeto também prevê a possibilidade de um juiz verificar indícios de fraude e comunicação com o Conselho Controle Atividades Financeiras.</code> | <code>1</code> |
| <code> O presente projeto de lei institui o Estatuto do Carbono Verde, regulamentando o mercado de carbono no âmbito dos povos tradicionais e do agronegócio, com foco em reduzir as emissões de gases de efeito estufa e promover o desenvolvimento sustentável. A proposta traz novas medidas, como a criação da Secretaria Especial do Carbono Verde, o Programa Nacional Obrigatória de Compensão de Emissões de GEE e o Plano Nacional Agrícola de Redução das Emissões de GEE. Além disso, a proposta estabelece a comercialização de créditos de carbono nos mercados obrigatórios, permitindo a inclusão de povos tradicionais e comunidades tradicionais na comercialização dos créditos.<br> O presente projeto de lei é uma iniciativa inovante para o desenvolvimento sustentável do país, garantindo o direito dos povos tradicionais e comunidades tradicionais a participar no mercado obrigatória de carbono verde mercado. Apresenta a proposto de lei nº 121218/20009, de 20009/201</code> | <code> A proposta de lei visa estabelecer incentivos fiscais para pessoas físicas e jurídicas que investem em projetos de desenvolvimento limpo, como o mercado de reduções certificadas de emissões (RCEs). O projeto prevê a criação de fundos de investimento para financiar esses projetos e a regulamentação da Comissão de Valores Mobiliários. A lei também estabelece que as quotas do Fundo de Investimento em Projetos de Desenvolvimento Limpo (FIMDL) serão isentas de imposto de renda e outras taxas. Além disso, a lei prevê a compensação de prejuízos para investidores residentes e domiciliados no exterior que venham a sofrer prejuízos decorrentes da alienação de quotas do FIMDL.</code> | <code>0</code> |
* Loss: [<code>ContrastiveLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#contrastiveloss) with these parameters:
```json
{
"distance_metric": "SiameseDistanceMetric.COSINE_DISTANCE",
"margin": 0.5,
"size_average": true
}
```
### Training Hyperparameters
#### Non-Default Hyperparameters
- `per_device_train_batch_size`: 2
- `per_device_eval_batch_size`: 2
- `num_train_epochs`: 1
- `multi_dataset_batch_sampler`: round_robin
#### All Hyperparameters
<details><summary>Click to expand</summary>
- `overwrite_output_dir`: False
- `do_predict`: False
- `prediction_loss_only`: True
- `per_device_train_batch_size`: 2
- `per_device_eval_batch_size`: 2
- `per_gpu_train_batch_size`: None
- `per_gpu_eval_batch_size`: None
- `gradient_accumulation_steps`: 1
- `eval_accumulation_steps`: None
- `learning_rate`: 5e-05
- `weight_decay`: 0.0
- `adam_beta1`: 0.9
- `adam_beta2`: 0.999
- `adam_epsilon`: 1e-08
- `max_grad_norm`: 1
- `num_train_epochs`: 1
- `max_steps`: -1
- `lr_scheduler_type`: linear
- `lr_scheduler_kwargs`: {}
- `warmup_ratio`: 0.0
- `warmup_steps`: 0
- `log_level`: passive
- `log_level_replica`: warning
- `log_on_each_node`: True
- `logging_nan_inf_filter`: True
- `save_safetensors`: True
- `save_on_each_node`: False
- `save_only_model`: False
- `no_cuda`: False
- `use_cpu`: False
- `use_mps_device`: False
- `seed`: 42
- `data_seed`: None
- `jit_mode_eval`: False
- `use_ipex`: False
- `bf16`: False
- `fp16`: False
- `fp16_opt_level`: O1
- `half_precision_backend`: auto
- `bf16_full_eval`: False
- `fp16_full_eval`: False
- `tf32`: None
- `local_rank`: 0
- `ddp_backend`: None
- `tpu_num_cores`: None
- `tpu_metrics_debug`: False
- `debug`: []
- `dataloader_drop_last`: False
- `dataloader_num_workers`: 0
- `dataloader_prefetch_factor`: None
- `past_index`: -1
- `disable_tqdm`: False
- `remove_unused_columns`: True
- `label_names`: None
- `load_best_model_at_end`: False
- `ignore_data_skip`: False
- `fsdp`: []
- `fsdp_min_num_params`: 0
- `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
- `fsdp_transformer_layer_cls_to_wrap`: None
- `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True}
- `deepspeed`: None
- `label_smoothing_factor`: 0.0
- `optim`: adamw_torch
- `optim_args`: None
- `adafactor`: False
- `group_by_length`: False
- `length_column_name`: length
- `ddp_find_unused_parameters`: None
- `ddp_bucket_cap_mb`: None
- `ddp_broadcast_buffers`: False
- `dataloader_pin_memory`: True
- `dataloader_persistent_workers`: False
- `skip_memory_metrics`: True
- `use_legacy_prediction_loop`: False
- `push_to_hub`: False
- `resume_from_checkpoint`: None
- `hub_model_id`: None
- `hub_strategy`: every_save
- `hub_private_repo`: False
- `hub_always_push`: False
- `gradient_checkpointing`: False
- `gradient_checkpointing_kwargs`: None
- `include_inputs_for_metrics`: False
- `fp16_backend`: auto
- `push_to_hub_model_id`: None
- `push_to_hub_organization`: None
- `mp_parameters`:
- `auto_find_batch_size`: False
- `full_determinism`: False
- `torchdynamo`: None
- `ray_scope`: last
- `ddp_timeout`: 1800
- `torch_compile`: False
- `torch_compile_backend`: None
- `torch_compile_mode`: None
- `dispatch_batches`: None
- `split_batches`: None
- `include_tokens_per_second`: False
- `include_num_input_tokens_seen`: False
- `neftune_noise_alpha`: None
- `optim_target_modules`: None
- `batch_sampler`: batch_sampler
- `multi_dataset_batch_sampler`: round_robin
</details>
### Training Logs
| Epoch | Step | Training Loss |
|:------:|:----:|:-------------:|
| 0.0912 | 500 | 0.0399 |
| 0.1824 | 1000 | 0.0263 |
| 0.2737 | 1500 | 0.0236 |
| 0.3649 | 2000 | 0.0217 |
| 0.4561 | 2500 | 0.0189 |
| 0.5473 | 3000 | 0.0179 |
| 0.6386 | 3500 | 0.0155 |
| 0.7298 | 4000 | 0.0137 |
| 0.8210 | 4500 | 0.011 |
| 0.9122 | 5000 | 0.0104 |
### Framework Versions
- Python: 3.10.14
- Sentence Transformers: 3.0.0
- Transformers: 4.39.3
- PyTorch: 2.2.0
- Accelerate: 0.30.1
- Datasets: 2.14.4
- Tokenizers: 0.15.1
## Citation
### BibTeX
#### Sentence Transformers
```bibtex
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}
```
#### ContrastiveLoss
```bibtex
@inproceedings{hadsell2006dimensionality,
author={Hadsell, R. and Chopra, S. and LeCun, Y.},
booktitle={2006 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR'06)},
title={Dimensionality Reduction by Learning an Invariant Mapping},
year={2006},
volume={2},
number={},
pages={1735-1742},
doi={10.1109/CVPR.2006.100}
}
```
<!--
## Glossary
*Clearly define terms in order to be accessible across audiences.*
-->
<!--
## Model Card Authors
*Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
-->
<!--
## Model Card Contact
*Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
--> |