SentenceTransformer based on indobenchmark/indobert-base-p1

This is a sentence-transformers model finetuned from indobenchmark/indobert-base-p1 on the indo_legalqa_triplets dataset. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.

Model Details

Model Description

Model Sources

Full Model Architecture

SentenceTransformer(
  (0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: BertModel 
  (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
)

Usage

Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

pip install -U sentence-transformers

Then you can load this model and run inference.

from sentence_transformers import SentenceTransformer

# Download from the 🤗 Hub
model = SentenceTransformer("retriever_checkpoints")
# Run inference
sentences = [
    'Apakah seseorang yang melakukan wanprestasi suatu perjanjian dapat dikatakan melakukan suatu penipuan?',
    'Dalam buku "Hukum Bisnis Untuk Perusahaan" karya Abdul R. Saliman (2005:47), dijelaskan beberapa kondisi yang menyebabkan debitur dapat dianggap melakukan wanprestasi.  Penjelasan tersebut merinci situasi-situasi di mana debitur, meskipun telah dinyatakan lalai, tetap gagal memenuhi kewajiban perjanjiannya atau hanya dapat memenuhi kewajiban tersebut melewati batas waktu yang telah ditentukan.  Buku ini memberikan pemahaman mendalam tentang berbagai aspek hukum bisnis, termasuk definisi dan implikasi wanprestasi dalam konteks perjanjian bisnis.  Penulis memaparkan  konsekuensi hukum bagi debitur yang melakukan wanprestasi, serta  hak-hak yang dimiliki oleh kreditur dalam menghadapi situasi tersebut.',
    "['(1)  a.  saksi dipanggil ke dalam ruang sidang seorang demi seorang  menurut urutan yang dipandang sebaik-baiknya oleh hakim ketua  sidang setelah mendengar pendapat penuntut umum, terdakwa  atau penasihat hukum;  b.  yang pertama-tama didengar keterangannya adalah korban yang  menjadi saksi;  c.  dalam hal ada saksi baik yang menguntungkan maupun yang  memberatkan terdakwa yang tercantum dalam surat pelimpahan  perkara dan atau yang diminta oleh terdakwa atau penasihat  hukum atau penuntut umum selama berlangsungnya sidang atau  sebelum dijatuhkannya putusan, hakim ketua sidang wajib  mendengar keterangan saksi tersebut.', '(2)  hakim ketua sidang menanyakan kepada saksi keterangan tentang nama  lengkap, tempat lahir, umur atau tanggal lahir, jenis kelamin,  kebangsaan, tempat tinggal, agama dan pekerjaan, selanjutnya apakah  ia kenal terdakwa sebelum terdakwa melakukan perbuatan yang menjadi  dasar dakwaan serta apakah ia berkeluarga sedarah atau semenda dan  sampai derajat keberapa dengan terdakwa, atau apakah ia suami atau  isteri terdakwa meskipun sudah bercerai atau terikat hubungan kerja  dengannya.', '(3)  sebelum memberi keterangan, saksi wajib mengucapkan sumpah atau  janji menurut cara agamanya masing-masing, bahwa ia akan memberikan  keterangan yang  sebenarnya dan tidak lain daripada yang sebenarnya.']",
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]

# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]

Training Details

Training Dataset

indo_legalqa_triplets

  • Dataset: indo_legalqa_triplets at 8da77c2
  • Size: 4,876 training samples
  • Columns: q, pos, and neg
  • Approximate statistics based on the first 1000 samples:
    q pos neg
    type string string string
    details
    • min: 9 tokens
    • mean: 54.48 tokens
    • max: 213 tokens
    • min: 3 tokens
    • mean: 91.98 tokens
    • max: 512 tokens
    • min: 11 tokens
    • mean: 482.53 tokens
    • max: 512 tokens
  • Samples:
    q pos neg
    Baru-baru ini ada berita mengenai orang yang menempelkan QRIS palsu di kotak amal masjid. Bagaimana sanksi terhadap seseorang yang memalsukan QRIS yang terpasang di kotak amal masjid atau tempat umum lainnya? Pasal 624 Undang-Undang ini mulai berlaku setelah 3 (tiga) tahun terhitung sejak tanggal diundangkan. Agar setiap orang mengetahuinya, memerintahkan pengundangan Undang-Undang ini dengan penempatannya dalam Lembaran Negara Republik Indonesia. ['(1) setiap orang yang mengoperasikan pesawat udara untuk kegiatan angkutan udara wajib memiliki sertifikat. (21 sertifrkat sebagaimana dimaksud pada ayat (1) terdiri atas: a. sertilikat operator pesawat udara (air operator ertificatel yang diberikan kepada badan hukum indonesia yang mengoperasikan pesawat udara sipil untuk angkutan udara niaga; atau b. sertiflkat pengoperasian pesawat udara (operating ertificatel yang diberikan kepada orang atau badan hukum indonesia yang pesawat udara sipil untuk angkutan udara bukan niaga. 19. pasal 42 dihapus. 21. ketentuan. . . sk no 132655 a 20. pasal 43 dihapus. presiden repuelik indonesia -430- 21. ketentuan pasal 45 diubah sehingga berbunyi sebagai berikut: pasal 45 ketentuan lebih lanjut mengenai tata cara dan prosedur memperoleh sertifrkat operator pesawat udara atau sertilikat pengoperasian pesawat udara dan kriteria, jenis, besaran denda, dan tata cara pengenaan sanksi administratif diatur dalam peraturan pemerintah. 22. ketentuan pasal 4...
    Mau tanya, jika ada seseorang yang mengalami pemukulan dengan luka biru apakah pelakunya bisa dipidana penjara atau denda? Saya pernah mendengar dari orang tua kalau polisi tidak akan menangani kasus ringan seperti ini. Bagaimana jika korban hanya mengalami luka biru atau memar? Bagaimana jika tersangka masih di bawah 18 tahun? Terima kasih. 5. penyelidikan adalah serangkaian tindakan penyelidik untuk mencari dan menemukan suatu peristiwa yang diduga sebagai tindak pidana guna menentukan dapat atau tidaknya dilakukan penyidikan menurut cara yang diatur dalam undang-undang ini ['(1) setiap orang yang mengoperasikan pesawat udara untuk kegiatan angkutan udara wajib memiliki sertifikat. (21 sertifrkat sebagaimana dimaksud pada ayat (1) terdiri atas: a. sertilikat operator pesawat udara (air operator ertificatel yang diberikan kepada badan hukum indonesia yang mengoperasikan pesawat udara sipil untuk angkutan udara niaga; atau b. sertiflkat pengoperasian pesawat udara (operating ertificatel yang diberikan kepada orang atau badan hukum indonesia yang pesawat udara sipil untuk angkutan udara bukan niaga. 19. pasal 42 dihapus. 21. ketentuan. . . sk no 132655 a 20. pasal 43 dihapus. presiden repuelik indonesia -430- 21. ketentuan pasal 45 diubah sehingga berbunyi sebagai berikut: pasal 45 ketentuan lebih lanjut mengenai tata cara dan prosedur memperoleh sertifrkat operator pesawat udara atau sertilikat pengoperasian pesawat udara dan kriteria, jenis, besaran denda, dan tata cara pengenaan sanksi administratif diatur dalam peraturan pemerintah. 22. ketentuan pasal 4...
    Setelah diajukan kasasi, terdakwa mendapat keringanan hukuman dari pidana mati menjadi pidana seumur hidup. Mungkinkah kasasi mengubah hukuman dan memberikan keringanan seperti itu? Mohon pencerahannya. ['(1) pemohon kasasi wajib mengajukan memori kasasi yang memuat alasan permohonan kasasinya dan dalam waktu empat belas hari setelah mengajukan permohonan tersebut, harus sudah menyerahkannya kepada panitera yang untuk itu ia memberikan surat tanda terima.', '(2) dalam hal pemohon kasasi adalah terdakwa yang kurang memahami hukum, panitera pada waktu menerima permohonan kasasi wajib menanyakan apakah alasan ia mengajukan permohonan tersebut dan untuk itu panitera membuatkan memori kasasinya.', '(3) alasan yang tersebut pada ayat (1) dan ayat (2) adalah sebagaimana dimaksud dalam pasal 253 ayat (1) undang-undang ini.', '(4) apabila dalam tenggang waktu sebagaimana dimaksud dalam ayat (1), pemohon terlambat menyerahkan memori kasasi maka hak untuk mengajukan permohonan kasasi gugur.', '(5) ketentuan sebagaimana diatur dalam pasal 246 ayat (3) berlaku juga untuk ayat (4) pasal ini.', '(6) tembusan memori kasasi yang diajukan oleh salah satu pihak, oleh panitera disampaika... ['(1) setiap orang yang mengoperasikan pesawat udara untuk kegiatan angkutan udara wajib memiliki sertifikat. (21 sertifrkat sebagaimana dimaksud pada ayat (1) terdiri atas: a. sertilikat operator pesawat udara (air operator ertificatel yang diberikan kepada badan hukum indonesia yang mengoperasikan pesawat udara sipil untuk angkutan udara niaga; atau b. sertiflkat pengoperasian pesawat udara (operating ertificatel yang diberikan kepada orang atau badan hukum indonesia yang pesawat udara sipil untuk angkutan udara bukan niaga. 19. pasal 42 dihapus. 21. ketentuan. . . sk no 132655 a 20. pasal 43 dihapus. presiden repuelik indonesia -430- 21. ketentuan pasal 45 diubah sehingga berbunyi sebagai berikut: pasal 45 ketentuan lebih lanjut mengenai tata cara dan prosedur memperoleh sertifrkat operator pesawat udara atau sertilikat pengoperasian pesawat udara dan kriteria, jenis, besaran denda, dan tata cara pengenaan sanksi administratif diatur dalam peraturan pemerintah. 22. ketentuan pasal 4...
  • Loss: TripletLoss with these parameters:
    {
        "distance_metric": "TripletDistanceMetric.EUCLIDEAN",
        "triplet_margin": 5
    }
    

Evaluation Dataset

indo_legalqa_triplets

  • Dataset: indo_legalqa_triplets at 8da77c2
  • Size: 610 evaluation samples
  • Columns: q, pos, and neg
  • Approximate statistics based on the first 610 samples:
    q pos neg
    type string string string
    details
    • min: 8 tokens
    • mean: 52.38 tokens
    • max: 223 tokens
    • min: 5 tokens
    • mean: 93.74 tokens
    • max: 512 tokens
    • min: 12 tokens
    • mean: 480.32 tokens
    • max: 512 tokens
  • Samples:
    q pos neg
    Bisakah pemilik Showroom mobil dikenakan UU Tindak Pidana Pencucian Uang apabila pembelinya menggunakan uang hasil tindak pidana korupsi untuk membeli mobil? Terima kasih admin hukumonline.com ['(1) penyedia barang dan/atau jasa lain sebagaimana dimaksud dalam pasal 17 ayat (1) huruf b wajib menyampaikan laporan transaksi yang dilakukan oleh pengguna jasa dengan mata uang rupiah dan/atau mata uang asing yang nilainya paling sedikit atau setara dengan rp500.000.000,00 (lima ratus juta rupiah) kepada ppatk.', '(2) laporan . . . (2) laporan transaksi sebagaimana dimaksud pada ayat (1) disampaikan paling lama 14 (empat belas) hari kerja terhitung sejak tanggal transaksi dilakukan.'] ['(1) setiap orang yang mengoperasikan pesawat udara untuk kegiatan angkutan udara wajib memiliki sertifikat. (21 sertifrkat sebagaimana dimaksud pada ayat (1) terdiri atas: a. sertilikat operator pesawat udara (air operator ertificatel yang diberikan kepada badan hukum indonesia yang mengoperasikan pesawat udara sipil untuk angkutan udara niaga; atau b. sertiflkat pengoperasian pesawat udara (operating ertificatel yang diberikan kepada orang atau badan hukum indonesia yang pesawat udara sipil untuk angkutan udara bukan niaga. 19. pasal 42 dihapus. 21. ketentuan. . . sk no 132655 a 20. pasal 43 dihapus. presiden repuelik indonesia -430- 21. ketentuan pasal 45 diubah sehingga berbunyi sebagai berikut: pasal 45 ketentuan lebih lanjut mengenai tata cara dan prosedur memperoleh sertifrkat operator pesawat udara atau sertilikat pengoperasian pesawat udara dan kriteria, jenis, besaran denda, dan tata cara pengenaan sanksi administratif diatur dalam peraturan pemerintah. 22. ketentuan pasal 4...
    Saya memiliki kasus, yaitu 2 minggu yang lalu toko mebel kami mengalami kebakaran, lalu api yang membakar toko mebel kami merambat, dan membakar salah satu rumah tetangga yang ada di samping toko mebel kami. Secara hukum, kami ingin mengerti apakah tetangga yang rumahnya terbakar dapat menuntut kami atas insiden itu? Dalam KUHP lama yang pada saat artikel ini diterbitkan masih berlaku, dan UU 1/2023 tentang KUHP baru yang berlaku terhitung 3 tahun sejak tanggal diundangkan,[2] yaitu tahun 2026, tidak ditemukan suatu definisi tentang kealpaan, sehingga perlu merujuk kepada suatu doktrin hukum. Spam & praktik penipuan; Komunitas YouTube dibangun atas dasar kepercayaan. Konten yang bertujuan untuk menipu, menyesatkan, mengirim spam, atau menipu pengguna lain tidak diizinkan di YouTube. Kebijakan spam, praktik penipuan, & penipuan Kebijakan peniruan identitas Kebijakan tautan eksternal Kebijakan keterlibatan palsu Kebijakan daftar putar Kebijakan tambahan. Konten sensitif; Kami berharap dapat melindungi penonton, kreator, dan khususnya anak di bawah umur. Itulah sebabnya kami memiliki aturan seputar menjaga keamanan anak, seks & ketelanjangan, dan tindakan menyakiti diri sendiri. Pelajari apa saja yang diizinkan di YouTube dan apa yang harus dilakukan jika Anda melihat konten yang tidak mematuhi kebijakan ini. Kebijakan konten ketelanjangan & seksual Kebijakan gambar mini Kebijakan keselamatan anak Kebijakan bunuh diri, menyakiti diri sendiri, dan gangguan makan Kebijakan bahasa vulgar. Konten kekerasan atau berbahaya; Ujaran kebencian, perilaku predator, kekerasan grafis, sera...
    Mohon izin bertanya bapak/ibu. Apakah menerima gadai kendaraan secara sadar hanya diperlihatkan fisik kendaraan dan STNK-nya saja apakah perbuatan yang salah secara hukum? Akhirnya berujung masalah ternyata mobil yang digadai itu adalah mobil rental. Apakah bisa yang menerima gadai itu dikenakan Pasal 480 KUHP? Terimakasih bapak atau ibu atas perhatiannya. Undang-Undang ini mulai berlaku setelah 3 (tiga) tahun terhitung sejak tanggal diundangkan. Agar setiap orang mengetahuinya, memerintahkan pengundangan Undang-Undang ini dengan penempatannya dalam Lembaran Negara Republik Indonesia. ['(1) setiap orang yang mengoperasikan pesawat udara untuk kegiatan angkutan udara wajib memiliki sertifikat. (21 sertifrkat sebagaimana dimaksud pada ayat (1) terdiri atas: a. sertilikat operator pesawat udara (air operator ertificatel yang diberikan kepada badan hukum indonesia yang mengoperasikan pesawat udara sipil untuk angkutan udara niaga; atau b. sertiflkat pengoperasian pesawat udara (operating ertificatel yang diberikan kepada orang atau badan hukum indonesia yang pesawat udara sipil untuk angkutan udara bukan niaga. 19. pasal 42 dihapus. 21. ketentuan. . . sk no 132655 a 20. pasal 43 dihapus. presiden repuelik indonesia -430- 21. ketentuan pasal 45 diubah sehingga berbunyi sebagai berikut: pasal 45 ketentuan lebih lanjut mengenai tata cara dan prosedur memperoleh sertifrkat operator pesawat udara atau sertilikat pengoperasian pesawat udara dan kriteria, jenis, besaran denda, dan tata cara pengenaan sanksi administratif diatur dalam peraturan pemerintah. 22. ketentuan pasal 4...
  • Loss: TripletLoss with these parameters:
    {
        "distance_metric": "TripletDistanceMetric.EUCLIDEAN",
        "triplet_margin": 5
    }
    

Training Hyperparameters

Non-Default Hyperparameters

  • per_device_train_batch_size: 4
  • num_train_epochs: 10

All Hyperparameters

Click to expand
  • overwrite_output_dir: False
  • do_predict: False
  • eval_strategy: no
  • prediction_loss_only: True
  • per_device_train_batch_size: 4
  • per_device_eval_batch_size: 8
  • per_gpu_train_batch_size: None
  • per_gpu_eval_batch_size: None
  • gradient_accumulation_steps: 1
  • eval_accumulation_steps: None
  • torch_empty_cache_steps: None
  • learning_rate: 5e-05
  • weight_decay: 0.0
  • adam_beta1: 0.9
  • adam_beta2: 0.999
  • adam_epsilon: 1e-08
  • max_grad_norm: 1.0
  • num_train_epochs: 10
  • max_steps: -1
  • lr_scheduler_type: linear
  • lr_scheduler_kwargs: {}
  • warmup_ratio: 0.0
  • warmup_steps: 0
  • log_level: passive
  • log_level_replica: warning
  • log_on_each_node: True
  • logging_nan_inf_filter: True
  • save_safetensors: True
  • save_on_each_node: False
  • save_only_model: False
  • restore_callback_states_from_checkpoint: False
  • no_cuda: False
  • use_cpu: False
  • use_mps_device: False
  • seed: 42
  • data_seed: None
  • jit_mode_eval: False
  • use_ipex: False
  • bf16: False
  • fp16: False
  • fp16_opt_level: O1
  • half_precision_backend: auto
  • bf16_full_eval: False
  • fp16_full_eval: False
  • tf32: None
  • local_rank: 0
  • ddp_backend: None
  • tpu_num_cores: None
  • tpu_metrics_debug: False
  • debug: []
  • dataloader_drop_last: False
  • dataloader_num_workers: 0
  • dataloader_prefetch_factor: None
  • past_index: -1
  • disable_tqdm: False
  • remove_unused_columns: True
  • label_names: None
  • load_best_model_at_end: False
  • ignore_data_skip: False
  • fsdp: []
  • fsdp_min_num_params: 0
  • fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
  • tp_size: 0
  • fsdp_transformer_layer_cls_to_wrap: None
  • accelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
  • deepspeed: None
  • label_smoothing_factor: 0.0
  • optim: adamw_torch
  • optim_args: None
  • adafactor: False
  • group_by_length: False
  • length_column_name: length
  • ddp_find_unused_parameters: None
  • ddp_bucket_cap_mb: None
  • ddp_broadcast_buffers: False
  • dataloader_pin_memory: True
  • dataloader_persistent_workers: False
  • skip_memory_metrics: True
  • use_legacy_prediction_loop: False
  • push_to_hub: False
  • resume_from_checkpoint: None
  • hub_model_id: None
  • hub_strategy: every_save
  • hub_private_repo: None
  • hub_always_push: False
  • gradient_checkpointing: False
  • gradient_checkpointing_kwargs: None
  • include_inputs_for_metrics: False
  • include_for_metrics: []
  • eval_do_concat_batches: True
  • fp16_backend: auto
  • push_to_hub_model_id: None
  • push_to_hub_organization: None
  • mp_parameters:
  • auto_find_batch_size: False
  • full_determinism: False
  • torchdynamo: None
  • ray_scope: last
  • ddp_timeout: 1800
  • torch_compile: False
  • torch_compile_backend: None
  • torch_compile_mode: None
  • include_tokens_per_second: False
  • include_num_input_tokens_seen: False
  • neftune_noise_alpha: None
  • optim_target_modules: None
  • batch_eval_metrics: False
  • eval_on_start: False
  • use_liger_kernel: False
  • eval_use_gather_object: False
  • average_tokens_across_devices: False
  • prompts: None
  • batch_sampler: batch_sampler
  • multi_dataset_batch_sampler: proportional

Training Logs

Click to expand
Epoch Step Training Loss
0.0820 100 0.192
0.1641 200 0.2369
0.2461 300 0.2237
0.3281 400 0.104
0.4102 500 0.1874
0.4922 600 0.1252
0.5742 700 0.1504
0.6563 800 0.1648
0.7383 900 0.0853
0.8203 1000 0.175
0.9024 1100 0.0344
0.9844 1200 0.1236
1.0664 1300 0.0595
1.1485 1400 0.1461
1.2305 1500 0.232
1.3126 1600 0.0418
1.3946 1700 0.1814
1.4766 1800 0.0383
1.5587 1900 0.0863
1.6407 2000 0.0106
1.7227 2100 0.0565
1.8048 2200 0.1017
1.8868 2300 0.1314
1.9688 2400 0.1178
2.0509 2500 0.0633
2.1329 2600 0.1472
2.2149 2700 0.2549
2.2970 2800 0.1677
2.3790 2900 0.0197
2.4610 3000 0.027
2.5431 3100 0.0187
2.6251 3200 0.0737
2.7071 3300 0.372
2.7892 3400 0.1667
2.8712 3500 0.557
2.9532 3600 0.9259
3.0353 3700 0.3995
3.1173 3800 0.1924
3.1993 3900 0.2783
3.2814 4000 0.05
3.3634 4100 0.0874
3.4454 4200 0.2844
3.5275 4300 0.0748
3.6095 4400 0.2222
3.6916 4500 0.2282
3.7736 4600 0.2622
3.8556 4700 0.0427
3.9377 4800 0.1407
4.0197 4900 0.087
4.1017 5000 0.1478
4.1838 5100 0.0905
4.2658 5200 0.0948
4.3478 5300 0.0267
4.4299 5400 0.037
4.5119 5500 0.0643
4.5939 5600 0.0712
4.6760 5700 0.3668
4.7580 5800 0.1919
4.8400 5900 0.1652
4.9221 6000 0.2161
5.0041 6100 0.2219
5.0861 6200 0.0696
5.1682 6300 0.0759
5.2502 6400 0.028
5.3322 6500 0.0954
5.4143 6600 0.098
5.4963 6700 0.0104
5.5783 6800 0.0379
5.6604 6900 0.0596
5.7424 7000 0.0073
5.8244 7100 0.0127
5.9065 7200 0.013
5.9885 7300 0.0149
6.0705 7400 0.035
6.1526 7500 0.0567
6.2346 7600 0.0442
6.3167 7700 0.0273
6.3987 7800 0.0527
6.4807 7900 0.0016
6.5628 8000 0.1043
6.6448 8100 0.0571
6.7268 8200 0.0523
6.8089 8300 0.0405
6.8909 8400 0.056
6.9729 8500 0.0316
7.0550 8600 0.0691
7.1370 8700 0.0451
7.2190 8800 0.0234
7.3011 8900 0.0038
7.3831 9000 0.0
7.4651 9100 0.0355
7.5472 9200 0.0
7.6292 9300 0.0226
7.7112 9400 0.0061
7.7933 9500 0.0277
7.8753 9600 0.0086
7.9573 9700 0.0824
8.0394 9800 0.0215
8.1214 9900 0.0416
8.2034 10000 0.0366
8.2855 10100 0.0061
8.3675 10200 0.0014
8.4495 10300 0.0018
8.5316 10400 0.0013
8.6136 10500 0.0
8.6957 10600 0.0021
8.7777 10700 0.0407
8.8597 10800 0.0
8.9418 10900 0.0413
9.0238 11000 0.058
9.1058 11100 0.0271
9.1879 11200 0.0
9.2699 11300 0.0064
9.3519 11400 0.0352
9.4340 11500 0.0344
9.5160 11600 0.0185
9.5980 11700 0.0
9.6801 11800 0.0185
9.7621 11900 0.0
9.8441 12000 0.0
9.9262 12100 0.0089

Framework Versions

  • Python: 3.11.12
  • Sentence Transformers: 3.4.1
  • Transformers: 4.51.1
  • PyTorch: 2.6.0+cu124
  • Accelerate: 1.5.2
  • Datasets: 3.5.0
  • Tokenizers: 0.21.1

Citation

BibTeX

Sentence Transformers

@inproceedings{reimers-2019-sentence-bert,
    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
    author = "Reimers, Nils and Gurevych, Iryna",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
    month = "11",
    year = "2019",
    publisher = "Association for Computational Linguistics",
    url = "https://arxiv.org/abs/1908.10084",
}

TripletLoss

@misc{hermans2017defense,
    title={In Defense of the Triplet Loss for Person Re-Identification},
    author={Alexander Hermans and Lucas Beyer and Bastian Leibe},
    year={2017},
    eprint={1703.07737},
    archivePrefix={arXiv},
    primaryClass={cs.CV}
}
Downloads last month
20
Safetensors
Model size
124M params
Tensor type
F32
·
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for ShoAnn/retriever_checkpoints

Finetuned
(37)
this model

Dataset used to train ShoAnn/retriever_checkpoints