metadata
tags:
- sentence-transformers
- sentence-similarity
- feature-extraction
- generated_from_trainer
- dataset_size:39780811
- loss:TripletLoss
base_model: DeepMount00/Italian-ModernBERT-base
widget:
- source_sentence: il lichen sclerosus può influenzare l'ano?
sentences:
- >-
1 HSV 1 di solito provoca l'herpes sulla bocca. 2 Le persone con il
virus possono avere herpes labiale o bolle di febbre sulla bocca. 3
L'HSV 1 può diffondersi ai genitali durante il sesso orale.4 L'HSV2 di
solito causa l'herpes intorno ai genitali o all'ano. 5 Le persone con
questo virus possono avere piaghe o vesciche intorno ai genitali o
all'ano. L'HSV 1 può essere diffuso ai genitali durante il sesso orale.
2 L'HSV2 di solito causa l'herpes intorno ai genitali o all'ano. 3 Le
persone con questo virus possono avere piaghe o vesciche intorno ai
genitali o all'ano.
- >-
4a edizione del Delray Beach Wine & Seafood Festival 7 e 8 novembre
Giunto alla sua quarta edizione, il Delray Beach Wine & Seafood Festival
2015 offre ai visitatori l'opportunità di passeggiare per le strade
fiancheggiate da palme di Delray sorseggiando un ottimo bicchiere di
vino o un piatto di prelibatezze frutti di mare.
- >-
Il lichen sclerosus può colpire la pelle in qualsiasi parte del corpo.
Ma più spesso coinvolge la pelle della vulva, il prepuzio del pene o la
pelle intorno all'ano. Chiunque può contrarre il lichen sclerosus, ma le
donne in postmenopausa hanno un rischio elevato. A volte il lichen
sclerosus migliora da solo e non avrai bisogno di alcun trattamento. Il
ichen sclerosus può colpire la pelle in qualsiasi parte del corpo. Ma
più spesso coinvolge la pelle della vulva, il prepuzio del pene o la
pelle intorno all'ano. Chiunque può contrarre il lichen sclerosus, ma le
donne in postmenopausa hanno un rischio elevato.
- source_sentence: quanto tempo grigliare una patata al forno?
sentences:
- >-
Da g, grammo a lb, quantità di libbre. Quantità: 1 g, grammo di Patata
dolce, cotta, al forno con la buccia, senza sale. Equivale a: 0.0022 di
libbre, libbra di patate dolci, cotte, al forno con la pelle, senza
sale. TOGGLE: da lb, pound a g, quantità in grammi al contrario.
Inserisci un nuovo valore g, grammo da cui convertire.
- >-
USA / Florida / Minneola / Mondo / USA / Florida / Minneola World /
Stati Uniti / Florida. lago Aggiungi categoria. È a forma di fagiolo e
raggiunge una profondità di 26 piedi vicino alla costa di Clermont.
lakewatch.ifas.ufl.edu/RevisedMaps05/LakeMaps/MinneolaL... 96 piedi
sopra il livello del mare.
- >-
Grigliare le patate al forno intere richiede 30-45 minuti al cartoccio
sulla griglia, se le patate sono intere. Se hai poco tempo, sbollenta le
patate per 10 minuti prima di metterle sulla griglia o nel microonde per
3 minuti per lato e dovrai solo grigliare le patate al forno per 5-10
minuti. Verifica se le patate sono cotte correttamente frugando con uno
stuzzicadenti. Grigliare le patate al forno che sono state tagliate a
fette o a spicchi richiede solo 5-10 minuti sulla griglia a fuoco medio,
a seconda dello spessore dei pezzi di patate. Per vedere se le patate
sono cotte correttamente, picchiettandole con uno stuzzicadenti.
Grigliare le patate al forno tagliate a fette o a spicchi richiede solo
5-10 minuti sulla griglia a fuoco medio, a seconda dello spessore dei
pezzi di patate.
- source_sentence: cosa sono le razze prepotenti?
sentences:
- >-
Le razze Bully (Staffordshire Bull Terrier, American Staffordshire
Terrier e American Pit Bull Terrier) sono un gruppo di tre razze spesso
conosciute collettivamente come Pit Bull, ma molti allevatori di
Staffordshire Bull Terrier e American Staffordshire Terrier disprezzano
notevolmente questo termine. le razze iniziarono nel 1835. In
quell'anno, il Parlamento britannico approvò il Cruelty to Animals Act.
Questo atto ha vietato due degli sport più popolari in Inghilterra, Bear
Baiting e Bull Baiting; sport di sangue che opponevano mastini contro
orsi e bulldog contro tori, spesso in combattimenti all'ultimo sangue.
- >-
diritto distributivo. (matematica). Una regola che stabilisce come
devono comportarsi l'una rispetto all'altra due operazioni binarie su un
insieme; in particolare, se +, ° sono due di tali operazioni
allora ° distribuisce su + significa a ° (b + c) = (a
° b) + (a ° c) per tutti gli a,b,c nell'insieme.1
Facebook. 2 Twitter.legge distributiva. (matematica). Una regola che
stabilisce come devono comportarsi l'una rispetto all'altra due
operazioni binarie su un insieme; in particolare, se +, ° sono
due di tali operazioni allora ° distribuisce su + significa a
° (b + c) = (a ° b) + (a ° c) per tutti gli
a,b,c dell'insieme. 1 Facebook.
- >-
Contare le pecore. Razze ovine. È difficile sapere quante razze di
pecore ci siano nel mondo, poiché solo i paesi sviluppati di solito
mantengono registri di razza. Tuttavia, si ritiene che esistano più
razze ovine che razze di qualsiasi altra specie di bestiame, ad
eccezione del pollame. In tutto il mondo, si stima che ci siano più di
1000 razze ovine distinte. Ci sono più di 50 razze solo negli Stati
Uniti.
- source_sentence: cos'è il documento sull'architettura del software?
sentences:
- >-
Migliora le funzioni renali: poiché il cavolo può aiutare a mantenere
sotto controllo il livello di zucchero nel sangue, aiuta anche a
mantenere le funzioni renali. Quando un diabetico ha livelli di zucchero
nel sangue estremamente alti (oltre 600 mg/dl), i reni cercano di
eliminare lo zucchero nel sangue in eccesso eliminandolo attraverso
l'urina.
- >-
Questo documento descrive in dettaglio quali versioni di IBM JDK sono
supportate in ogni versione e release del sistema operativo IBM i.
Ambiente. Risolvere il problema. Per ulteriori spiegazioni sui JDK IBM i
e su come utilizzarli nell'ambiente del server IBM i, fare riferimento
al seguente documento tecnico del software IBM.
- >-
Il Software Architecture Document (SAD) fornisce una panoramica completa
dell'architettura dell'Online Catering Service 1.0 offerto da Yummy Inc.
Presenta una serie di diverse visualizzazioni dell'architettura per
rappresentare i diversi aspetti del sistema.
- source_sentence: qual è il più grande il mare o l'oceano
sentences:
- >-
L'Oceano Pacifico è il più grande dei cinque oceani del mondo, seguito
dall'Oceano Atlantico, dall'Oceano Indiano, dall'Oceano Meridionale e
dall'Oceano Artico. Copre un'area di circa 155 milioni di chilometri
quadrati (circa 60 milioni di miglia quadrate). L'Oceano Pacifico è il
più grande dei cinque oceani del mondo, seguito dall'Oceano Atlantico e
dall'Oceano Indiano , Oceano Meridionale e Oceano Artico. Copre un'area
di circa 155 milioni di chilometri quadrati (circa 60 milioni di miglia
quadrate).
- >-
Il tamarino leone d'oro è dichiarato specie in pericolo di estinzione
dall'Unione internazionale per la conservazione della natura a causa
della drastica deforestazione del suo habitat naturale. A causa di... Il
tamarino leone d'oro è dichiarato specie in pericolo di estinzione
dall'Unione internazionale per la conservazione della natura a causa
della drastica deforestazione del suo habitat naturale.
- >-
Il fiume Chang Jiang, o fiume Yangtze, sfocia nel mare della Cina
orientale. Questo mare è una parte dell'Oceano Indiano vicino all'Asia.
3 persone l'hanno trovato utile. Modificare.
pipeline_tag: sentence-similarity
library_name: sentence-transformers
metrics:
- cosine_accuracy
model-index:
- name: SentenceTransformer based on DeepMount00/Italian-ModernBERT-base
results:
- task:
type: triplet
name: Triplet
dataset:
name: mmarco dev
type: mmarco_dev
metrics:
- type: cosine_accuracy
value: 0.9089999794960022
name: Cosine Accuracy on Dev
- type: cosine_accuracy
value: 0.9210000038146973
name: Cosine Accuracy on Test
Italian-ModernBERT-base-embed-mmarco-triplet
This is a sentence-transformers model finetuned from DeepMount00/Italian-ModernBERT-base on the mmarco dataset. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
Model Details
Model Description
- Model Type: Sentence Transformer
- Base model: DeepMount00/Italian-ModernBERT-base
- Maximum Sequence Length: 8192 tokens
- Output Dimensionality: 768 dimensions
- Similarity Function: Cosine Similarity
- Training Dataset:
- mmarco
Model Sources
- Documentation: Sentence Transformers Documentation
- Repository: Sentence Transformers on GitHub
- Hugging Face: Sentence Transformers on Hugging Face
Full Model Architecture
SentenceTransformer(
(0): Transformer({'max_seq_length': 8192, 'do_lower_case': False}) with Transformer model: ModernBertModel
(1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
)
Usage
Direct Usage (Sentence Transformers)
First install the Sentence Transformers library:
pip install -U sentence-transformers
Then you can load this model and run inference.
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("Italian-ModernBERT-base-embed-mmarco-triplet")
# Run inference
sentences = [
"qual è il più grande il mare o l'oceano",
"L'Oceano Pacifico è il più grande dei cinque oceani del mondo, seguito dall'Oceano Atlantico, dall'Oceano Indiano, dall'Oceano Meridionale e dall'Oceano Artico. Copre un'area di circa 155 milioni di chilometri quadrati (circa 60 milioni di miglia quadrate). L'Oceano Pacifico è il più grande dei cinque oceani del mondo, seguito dall'Oceano Atlantico e dall'Oceano Indiano , Oceano Meridionale e Oceano Artico. Copre un'area di circa 155 milioni di chilometri quadrati (circa 60 milioni di miglia quadrate).",
"Il fiume Chang Jiang, o fiume Yangtze, sfocia nel mare della Cina orientale. Questo mare è una parte dell'Oceano Indiano vicino all'Asia. 3 persone l'hanno trovato utile. Modificare.",
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]
# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
Evaluation
Metrics
Triplet
- Dataset:
mmarco_dev
- Evaluated with
TripletEvaluator
Metric | Value |
---|---|
cosine_accuracy | 0.909 |
Triplet
- Dataset:
mmarco_test
- Evaluated with
TripletEvaluator
Metric | Value |
---|---|
cosine_accuracy | 0.921 |
Training Details
Training Dataset
mmarco
- Dataset: mmarco
- Total Size: 39,780,811
- Size: 50,000 training samples
- Columns:
query
,positive
, andnegative
- Approximate statistics based on the first 1000 samples:
query positive negative type string string string details - min: 4 tokens
- mean: 10.91 tokens
- max: 24 tokens
- min: 22 tokens
- mean: 92.84 tokens
- max: 276 tokens
- min: 19 tokens
- mean: 88.55 tokens
- max: 242 tokens
- Samples:
query positive negative chi suona è granger su ncis la
Firmato per un ruolo ricorrente in NCIS: Los Angeles come assistente del direttore del servizio investigativo criminale navale Owen Granger, Ferrer è stato promosso a personaggio regolare per la quinta stagione il 6 febbraio 2013. È anche apparso nel film del 2013 Iron Man 3 come il vice. -Presidente.
NCIS: L'agente Abigail Borin di CGIS (Coast Guard Investigative Service) è interpretata da Diane Neal, che ha anche interpretato ADA Casey Novak in Law and Order, SVU. L'agente Borin è simile nello stile di comando e nel temperamento all'agente speciale Leroy Jethro Gibbs dell'NCIS.
come si chiama la strada principale di hershey pa?
Chocolate Avenue è una strada di Hershey, in Pennsylvania, che passa davanti all'originale Hershey's Chocolate Factory ed è considerata la strada principale della città.
Milton S. Hershey è nato il 13 settembre 1857 da Henry e Veronica Fanny Snavely Hershey. La sua famiglia erano membri della comunità mennonita della Pennsylvania. I suoi antenati erano svizzeri e tedeschi e si erano stabiliti in Pennsylvania nei primi anni del 1700. Crebbe parlando l'olandese della Pennsylvania. ilton S. Hershey nacque il 13 settembre 1857 da Henry e Veronica Fanny Snavely Hershey. La sua famiglia erano membri della comunità mennonita della Pennsylvania. I suoi antenati erano svizzeri e tedeschi e si erano stabiliti in Pennsylvania nei primi anni del 1700. È cresciuto parlando l'olandese della Pennsylvania.
definizione di dissoluzione in geologia
Rocce solubili (dissoluzione) Sinkhole; mentre l'acqua filtra attraverso le rocce sopra, il sale inizia a dissolversi e le rocce sopra cadono a formare una dolina. La dissoluzione del suolo si verifica quando l'acqua che passa attraverso rocce solubili produce cavità sotterranee e sistemi di grotte. Tali cavità riducono l'appoggio al terreno sovrastante e possono provocare cedimenti localizzati delle rocce e dei depositi sovrastanti.
Per porre fine all'esistenza di una società o LLC, un'entità deve presentare gli articoli di scioglimento o altra forma di scioglimento o annullamento dei documenti con il Segretario di Stato. I requisiti variano in base alla giurisdizione.
- Loss:
TripletLoss
with these parameters:{ "distance_metric": "TripletDistanceMetric.EUCLIDEAN", "triplet_margin": 5 }
Evaluation Dataset
mmarco
- Dataset: mmarco
- Size: 2,000 evaluation samples
- Columns:
query
,positive
, andnegative
- Approximate statistics based on the first 1000 samples:
query positive negative type string string string details - min: 4 tokens
- mean: 11.25 tokens
- max: 37 tokens
- min: 15 tokens
- mean: 94.27 tokens
- max: 309 tokens
- min: 24 tokens
- mean: 90.05 tokens
- max: 305 tokens
- Samples:
query positive negative significato del tatuaggio del drago e del lupo
Wolf Tattoo: significati e disegni. Il tatuaggio del lupo è un ottimo modo per mostrare lealtà e devozione alla famiglia. Alcune persone hanno il loro intero branco di persone care inchiostrate o si fanno tatuare una sola zampa di lupo e hanno i nomi dei propri cari inchiostrati all'interno del disegno. Il tatuaggio del lupo può anche rappresentare l'amore.
Qual è il significato di Apocalisse capitolo 12? Di cosa parla Apocalisse 12? Chi sono la donna, il bambino e il drago descritti in Apocalisse capitolo 12? Qual è il significato di Apocalisse capitolo 12? Apocalisse capitolo 12 contiene una descrizione di una donna, che è vestita di sole, con la luna sotto i suoi piedi e una corona di dodici stelle in cima alla sua testa. La donna è incinta e sta per partorire. È inseguita da un grande drago rosso, la cui coda ha spazzato via un terzo delle stelle dal cielo e le ha gettate sulla terra.
cosa significa amianto friabile
L'amianto friabile si riferisce a qualsiasi tipo di amianto fragile che può sgretolarsi con poca forza o pressione. Qualsiasi materiale che può essere frantumato con le mani e contiene amianto è considerato amianto friabile e deve essere rimosso.
Il prezzo del test dell'aria dell'amianto di solito varia a seconda del tipo e del numero di test richiesti, dovresti ottenere stime specifiche per il tuo lavoro e dovrebbero essere inclusi nel calcolo di quanto costa rimuovere l'amianto. Ottieni ulteriori informazioni sui costi dei test dell'aria dell'amianto.
che ha giocato a lois lane in superman
Noel Neill. Noel Darleen Neill (25 novembre 1920  3 luglio 2016) è stata un'attrice statunitense. È nota per aver interpretato Lois Lane nei serial cinematografici Superman (1948) e Atom Man vs. Superman (1950), nonché nella serie televisiva degli anni '50 Adventures of Superman. È apparsa in 80 film e serie televisive nella sua carriera.
esiste ed è un supplente di . Wonder Woman è un classico supereroe della DC Comics. Condivide la sua eredità con personaggi del calibro di Superman, Batman e Flash. Wonder Woman è un classico supereroe della DC Comics. Condivide la sua eredità con personaggi del calibro di Superman, Batman e Flash.
- Loss:
TripletLoss
with these parameters:{ "distance_metric": "TripletDistanceMetric.EUCLIDEAN", "triplet_margin": 5 }
Training Hyperparameters
Non-Default Hyperparameters
eval_strategy
: stepsper_device_train_batch_size
: 16per_device_eval_batch_size
: 16learning_rate
: 2e-05num_train_epochs
: 1warmup_ratio
: 0.1fp16
: Trueload_best_model_at_end
: Truebatch_sampler
: no_duplicates
All Hyperparameters
Click to expand
overwrite_output_dir
: Falsedo_predict
: Falseeval_strategy
: stepsprediction_loss_only
: Trueper_device_train_batch_size
: 16per_device_eval_batch_size
: 16per_gpu_train_batch_size
: Noneper_gpu_eval_batch_size
: Nonegradient_accumulation_steps
: 1eval_accumulation_steps
: Nonetorch_empty_cache_steps
: Nonelearning_rate
: 2e-05weight_decay
: 0.0adam_beta1
: 0.9adam_beta2
: 0.999adam_epsilon
: 1e-08max_grad_norm
: 1.0num_train_epochs
: 1max_steps
: -1lr_scheduler_type
: linearlr_scheduler_kwargs
: {}warmup_ratio
: 0.1warmup_steps
: 0log_level
: passivelog_level_replica
: warninglog_on_each_node
: Truelogging_nan_inf_filter
: Truesave_safetensors
: Truesave_on_each_node
: Falsesave_only_model
: Falserestore_callback_states_from_checkpoint
: Falseno_cuda
: Falseuse_cpu
: Falseuse_mps_device
: Falseseed
: 42data_seed
: Nonejit_mode_eval
: Falseuse_ipex
: Falsebf16
: Falsefp16
: Truefp16_opt_level
: O1half_precision_backend
: autobf16_full_eval
: Falsefp16_full_eval
: Falsetf32
: Nonelocal_rank
: 0ddp_backend
: Nonetpu_num_cores
: Nonetpu_metrics_debug
: Falsedebug
: []dataloader_drop_last
: Falsedataloader_num_workers
: 0dataloader_prefetch_factor
: Nonepast_index
: -1disable_tqdm
: Falseremove_unused_columns
: Truelabel_names
: Noneload_best_model_at_end
: Trueignore_data_skip
: Falsefsdp
: []fsdp_min_num_params
: 0fsdp_config
: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}tp_size
: 0fsdp_transformer_layer_cls_to_wrap
: Noneaccelerator_config
: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}deepspeed
: Nonelabel_smoothing_factor
: 0.0optim
: adamw_torchoptim_args
: Noneadafactor
: Falsegroup_by_length
: Falselength_column_name
: lengthddp_find_unused_parameters
: Noneddp_bucket_cap_mb
: Noneddp_broadcast_buffers
: Falsedataloader_pin_memory
: Truedataloader_persistent_workers
: Falseskip_memory_metrics
: Trueuse_legacy_prediction_loop
: Falsepush_to_hub
: Falseresume_from_checkpoint
: Nonehub_model_id
: Nonehub_strategy
: every_savehub_private_repo
: Nonehub_always_push
: Falsegradient_checkpointing
: Falsegradient_checkpointing_kwargs
: Noneinclude_inputs_for_metrics
: Falseinclude_for_metrics
: []eval_do_concat_batches
: Truefp16_backend
: autopush_to_hub_model_id
: Nonepush_to_hub_organization
: Nonemp_parameters
:auto_find_batch_size
: Falsefull_determinism
: Falsetorchdynamo
: Noneray_scope
: lastddp_timeout
: 1800torch_compile
: Falsetorch_compile_backend
: Nonetorch_compile_mode
: Nonedispatch_batches
: Nonesplit_batches
: Noneinclude_tokens_per_second
: Falseinclude_num_input_tokens_seen
: Falseneftune_noise_alpha
: Noneoptim_target_modules
: Nonebatch_eval_metrics
: Falseeval_on_start
: Falseuse_liger_kernel
: Falseeval_use_gather_object
: Falseaverage_tokens_across_devices
: Falseprompts
: Nonebatch_sampler
: no_duplicatesmulti_dataset_batch_sampler
: proportional
Training Logs
Epoch | Step | Training Loss | Validation Loss | mmarco_dev_cosine_accuracy |
---|---|---|---|---|
-1 | -1 | - | - | 0.6285 |
0.08 | 250 | 1.8669 | 2.4032 | 0.7960 |
0.16 | 500 | 1.793 | 1.6328 | 0.8600 |
0.24 | 750 | 1.4301 | 1.3971 | 0.8930 |
0.32 | 1000 | 1.3361 | 1.2686 | 0.8955 |
0.4 | 1250 | 1.237 | 1.2151 | 0.909 |
Test Logs
Epoch | Step | Training Loss | Validation Loss | mmarco_dev_cosine_accuracy |
---|---|---|---|---|
-1 | -1 | - | - | 0.9210 |
- The bold row denotes the saved checkpoint.
Framework Versions
- Python: 3.11.11
- Sentence Transformers: 3.5.0.dev0
- Transformers: 4.50.0.dev0
- PyTorch: 2.5.1+cu124
- Accelerate: 1.3.0
- Datasets: 3.3.2
- Tokenizers: 0.21.0
Citation
BibTeX
Sentence Transformers
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}
TripletLoss
@misc{hermans2017defense,
title={In Defense of the Triplet Loss for Person Re-Identification},
author={Alexander Hermans and Lucas Beyer and Bastian Leibe},
year={2017},
eprint={1703.07737},
archivePrefix={arXiv},
primaryClass={cs.CV}
}