SentenceTransformer based on selmanbaysan/berturk_base_contrastive_loss_training

This is a sentence-transformers model finetuned from selmanbaysan/berturk_base_contrastive_loss_training on the msmarco-tr, fiqa-tr, scifact-tr, nfcorpus-tr, multinli-tr, snli-tr, stsb-tr and wmt16 datasets. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.

Model Details

Model Description

Model Sources

Full Model Architecture

SentenceTransformer(
  (0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: BertModel 
  (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
)

Usage

Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

pip install -U sentence-transformers

Then you can load this model and run inference.

from sentence_transformers import SentenceTransformer

# Download from the 🤗 Hub
model = SentenceTransformer("selmanbaysan/berturk-base_fine_tuned")
# Run inference
sentences = [
    'Stoklara nasıl yatırım yapabilirim?',
    "\nBu soru yüklü ama denemek için elimden geleni yapacağım. Öncelikle, hisse senetlerine yatırım yapmadan önce hazır olup olmadığınızı belirlemeniz gerekir. Yüksek faizli borcunuz varsa, hisse senetlerine yatırım yapmadan önce onu ödemeniz daha iyi olacaktır. Hisse senetleri uzun vadede yaklaşık %8-10 getiri sağlar, bu nedenle %8-10'dan daha yüksek faizli herhangi bir borcunuzu ödemeniz daha iyi olur. Çoğu insan, 401k'larında veya Roth IRA'larında ortak fonlar aracılığıyla hisse senetlerine başlar. Bireysel hisse senetleri yerine ortak fonlara yatırım yapmak istiyorsanız, çok okumalı ve öğrenmelisiniz. Bir aracı hesap veya hisse senedi aklınızda varsa, doğrudan şirkete DRIP (temettü yeniden yatırma planı) aracılığıyla yatırım yapabilirsiniz. Farklı aracı kurumları karşılaştırarak size en uygun olanı belirlemeniz gerekir. İnternet bilgisine sahip olduğunuzu göz önünde bulundurarak, daha düşük komisyonlar sunan bir indirimli aracı kurum kullanmanızı öneririm. İyi bir kılavuz, yatırım yaptığınız tutarın %1'inden daha az komisyon ödemektir. Çevrimiçi aracı hesabınızı açıp içine para yatırdıktan sonra, hisse senedi satın alma işlemi oldukça basittir. Satın almak istediğiniz hisse senedi miktarı için bir emir verin. Bu, mevcut piyasa fiyatında bir satın alma anlamına gelen bir piyasa emri olabilir. Veya fiyatı kontrol edebileceğiniz bir sınır emri kullanabilirsiniz. Yeni başlayanlar için birçok iyi kitap vardır. Kişisel olarak, Motley Fool'dan öğrendim. Ve son olarak, eğlenin. Öğrendiğiniz kadarını öğrenin ve kulübünüzün tadını çıkarın.",
    "Öncelikle varsayımınız doğru: Büyük bir miktar YetAnotherCryptoCoin'i ICO'sundan kısa bir süre sonra nasıl nakde çevirebilirsiniz? Kripto borsaları yeni bir para birimini eklemek için biraz zaman alır, hatta hiç eklemeyebilirler. Ve hatta eklediklerinde, işlem hacmi genellikle düşüktür. Sanırım bu, yatırımcılar için gerçekten çekici olmayan şeydir (teknoloji tutkunlarından ayrı olarak), yüksek volatilite dışında. Güvenilir bir işlem yeteneği tamamen eksikliği.",
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]

# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]

Evaluation

Metrics

Semantic Similarity

Metric Value
pearson_cosine 0.811
spearman_cosine 0.8168

Binary Classification

Metric snli-tr xnli-tr wmt16 msmarco-tr fiqa-tr quora-tr nfcorpus-tr
cosine_accuracy 0.7326 0.7345 0.999 1.0 0.9992 0.9999 0.9999
cosine_accuracy_threshold 0.6573 0.7268 0.2129 -0.0468 0.0354 0.1629 -0.1333
cosine_f1 0.6006 0.6036 0.9995 1.0 0.9996 0.9999 1.0
cosine_f1_threshold 0.4847 0.5046 0.2129 -0.0468 0.0354 0.1629 -0.1333
cosine_precision 0.5034 0.5 1.0 1.0 1.0 1.0 1.0
cosine_recall 0.7444 0.7614 0.999 1.0 0.9992 0.9999 0.9999
cosine_ap 0.6132 0.6338 1.0 1.0 1.0 1.0 1.0
cosine_mcc 0.3562 0.359 0.0 0.0 0.0 0.0 0.0

Training Details

Training Datasets

msmarco-tr

msmarco-tr

  • Dataset: msmarco-tr at f03d837
  • Size: 253,332 training samples
  • Columns: anchor and positive
  • Approximate statistics based on the first 1000 samples:
    anchor positive
    type string string
    details
    • min: 4 tokens
    • mean: 9.75 tokens
    • max: 28 tokens
    • min: 18 tokens
    • mean: 81.59 tokens
    • max: 512 tokens
  • Samples:
    anchor positive
    Spagetti ve et sosu servisinde kaç kalori Gıda Bilgisi. Makarna Yemekleri kategorisinde Et Soslu Spagetti ile 100 g / mL'ye göre toplam 90.0 kalori ve aşağıdaki beslenme gerçekleri vardır: 5.1 g protein, 15.2 g karbonhidrat ve 1.0 g yağ.
    galveston okyanusu ne kadar derin galveston çok sığ olduğu için mucky - Eğer kıyıdan 5 mil yürümek olsaydı, asla 10 veya 12 feet derinliğinden fazla olmazdı. Galveston Körfezi çok sığ, sadece 9 feet derinliğinde, bu yüzden körfezden ve derin okyanusa bir kez çıktığınızda, su o kadar çamurlu olmayacak.
    amlodipin diyabete neden olabilir Hipertansiyon tedavisi için Amlodipin tedavisine konduğunuzda referanslara göre, diyabetin yeni başlangıcını geliştirme olasılığınız %34 daha düşüktür. Hipertansiyon tedavisi için Amlodipin tedavisine konduğunuzda referanslara göre, diyabetin yeni başlangıcını geliştirme olasılığınız %34 daha düşüktür. Küçük düzenleme?
  • Loss: MultipleNegativesRankingLoss with these parameters:
    {
        "scale": 20.0,
        "similarity_fct": "cos_sim"
    }
    
fiqa-tr

fiqa-tr

  • Dataset: fiqa-tr at bbc9e91
  • Size: 14,166 training samples
  • Columns: anchor and positive
  • Approximate statistics based on the first 1000 samples:
    anchor positive
    type string string
    details
    • min: 4 tokens
    • mean: 17.67 tokens
    • max: 54 tokens
    • min: 9 tokens
    • mean: 196.19 tokens
    • max: 512 tokens
  • Samples:
    anchor positive
    Bir iş gezisinde ne tür masraflar iş masrafı olarak kabul edilir? IRS'a ait ilgili rehberlik. Genel olarak söyleyebileceğim tek şey, işinizin giderlerinin düşebileceği yönündedir. Ancak bu, koşullara ve düşmek istediğiniz gider türüne bağlıdır. Seyahat İş seyahatinden dolayı evden uzakta olan vergi mükellefleri, ilişkili giderleri düşebilirler, bu da varış noktasına ulaşma maliyetini, konaklama ve yemek masraflarını ve diğer normal ve gerekli giderleri içerir. Mükellefler, görevlerinin onları evden önemli ölçüde daha uzun süre uzak tutması ve iş taleplerini karşılamak için uyku veya dinlenmeye ihtiyaç duymaları durumunda "evden uzakta" olarak kabul edilirler. Yemek ve yan masrafların gerçek maliyetleri düşürülebilir veya mükellef, standart yemek yardımı ve azaltılmış kayıt tutma gereklilikleri kullanabilir. Kullanılan yönteme bakılmaksızın, yemek giderleri genellikle daha önce belirtildiği gibi %50 ile sınırlıdır. Sadece gerçek konaklama masrafları gider olarak talep edilebilir ve belgeler için makbuzlar tutulmalıdır. Giderler makul ve uygun olmalıdı...
    İş Gideri - Kaza Sırasında İş Gezisi Sırasında Uygulanan Araba Sigortası Teminat Tutarı Genel bir kural olarak, mil ölçümü indirimi veya gerçek giderler indirimi arasında seçim yapmanız gerekir. Fikir, mil ölçümü indiriminin aracın kullanımının tüm maliyetlerini kapsamasıdır. Park ücretleri ve otoyol ücretleri gibi istisnalar, her iki yöntemin altında ayrı ayrı indirilebilir. Mil ölçümü indirimi talep ederseniz sigorta maliyetlerini açık bir şekilde indiremezsiniz. Ayrı olarak, muhtemelen aracınızın kazaya bağlı olarak hasar kaybı olarak bir teminat indirimi indiremeyeceksiniz. Öncelikle teminattan 100 dolar çıkarırsınız ve sonra onu vergi beyannamenizden ayarlanan brüt gelirinize (AGI) böleriz. Teminatınız AGI'nızın %10'undan fazla ise onu indirebilirsiniz. Not edin ki, 1500 dolar teminatı olan biri bile yıllık 14.000 doların üzerinde gelir elde ederse hiçbir şey indiremez. Çoğu insan için, sigorta teminatı gelire göre yeterince büyük değil, bu nedenle vergi indirimi için uygun değildir. Kaynak
    Yeni bir çevrimiçi işletme başlatmak Amerika Birleşik Devletleri'nin çoğu eyaleti, yukarıda belirtildiği gibi, aşağıdakine benzer kurallara sahiptir: Kayıt ücretleri ödemeniz neredeyse kesin. Düzenleme şeklinize bağlı olarak, işletmeniz için ayrı bir vergi beyannamesi doldurmanız gerekebilir veya gerekmeyebilir. (Vergi amaçları için tek bir işletme sahibiyseniz, kişisel Form 1040'ınızın Ek C'sini doldurursunuz.) Vergi ödeme durumunuz, net kazancınızın olup olmamasına bağlıdır. Bazı kayıpların da indirilebilir olabileceği mümkündür. (Dikkat edin, net kazancınız olmasa bile bir beyanname sunmanız gerekebilir - Beyanname sunmak ve vergi ödemek aynı şey değildir, çünkü beyannameniz hiçbir vergi borcu göstermeyebilir.) Ayrıca, eyalet düzeyinde, ne sattığınız ve nasıl sattığınıza bağlı olarak, gelir vergisi ötesinde ek ücretler veya vergiler ödemeniz gerekebilir. (Örneğin, satış vergisi veya franchise vergileri devreye girebilir.) Bu konuda kendi eyalet yasalarını kontrol etmeniz gerekir. Her zaman, durumunuza ve eyaletinize öz...
  • Loss: MultipleNegativesRankingLoss with these parameters:
    {
        "scale": 20.0,
        "similarity_fct": "cos_sim"
    }
    
scifact-tr

scifact-tr

  • Dataset: scifact-tr at 382de5b
  • Size: 919 training samples
  • Columns: anchor and positive
  • Approximate statistics based on the first 919 samples:
    anchor positive
    type string string
    details
    • min: 8 tokens
    • mean: 27.49 tokens
    • max: 73 tokens
    • min: 91 tokens
    • mean: 360.13 tokens
    • max: 512 tokens
  • Samples:
    anchor positive
    0 boyutlu biyomalzemeler indüktif özelliklere sahip değildir. Nanoteknolojiler, kök hücreleri ölçmek, anlamak ve manipüle etmek için yararlı olabilecek yeni ortaya çıkan platformlardır. Örnekler arasında, kök hücre etiketleme ve in vivo izleme için manyetik nanopartiküller ve kuantum noktaları; hücre içi gen/oligonükleotit ve protein/peptit teslimatı için nanopartiküller, karbon nanotüpler ve polypleksler; ve kök hücre farklılaştırması ve nakli için mühendislik yapılmış nanometre ölçeği destekler yer alır. Bu inceleme, kök hücre izleme, farklılaştırma ve nakli için nanoteknolojilerin kullanımını inceler. Ayrıca, yararlılıkları ve sitotoksisiteyle ilgili olası endişeleri tartışırız.
    Birleşik Krallık'ta 1 milyonun 5'inde anormal PrP pozitifliği vardır.
    ## Amaçlar
    Bovin spongiform ensefalopati (BSE) salgınından sonra alt klinik prion enfeksiyonunun yaygınlığı hakkında mevcut tahminleri daha iyi anlamak ve daha geniş bir doğum kohortunun etkilenip etkilenmediğini görmek, ayrıca kan ve kan ürünleri yönetimi ve cerrahi aletlerin işlenmesiyle ilgili sonuçları daha iyi anlamak için arşivlenmiş apandisit örnekleri üzerine ek bir anket yapmak.

    ## Tasarım
    Büyük ölçekli, kalıcı olarak bağlantısı kesilmiş ve anonimleştirilmiş arşivlenmiş apandisit örnekleri anketini tekrarlamak.

    ## Çalışma Alanı
    Daha önceki anketin katılımının daha düşük olduğu bölgelerde ek hastaneler dahil olmak üzere, Birleşik Krallık'taki 41 hastanenin patoloji bölümlerinden arşivlenmiş apandisit örnekleri.

    ## Örnek
    32.441 arşivlenmiş apandisit örneği, formalin ile sabitlenmiş ve parafinle gömülmüş ve anormal prion proteini (PrP) varlığı için test edilmiş.

    ## Sonuçlar
    32.441 apandisit örneğinin 16'sı anormal PrP için pozitif çıktı, bu da genel bir yaygınlık oranı 493/m...
    Kolon ve rektum kanseri hastalarının %1-1'i bölgesel veya uzak metastazlarla teşhis edilir.
    Medikare'nin geri ödeme politikası 1998'de kolon kanseri riskini artıran hastalar için tarama kolon skopi kapsamı sağlayarak ve 2001'de tüm bireyler için tarama kolon skopi kapsamı genişleterek değiştirildi.

    Amaç: Medikare geri ödeme politikasındaki değişikliklerin kolon skopi kullanımı veya erken evre kolon kanseri teşhisi artışı ile ilişkili olup olmadığını belirlemek.

    Tasarım, Ayar ve Katılımcılar: 1992-2002 yılları arasında 67 yaş ve üstü, birincil tanısı kolon kanseri olan ve Surveillance, Epidemiology ve Sonuçları (SEER) Medikare bağlantılı veritabanındaki hastalar ile SEER alanlarında ikamet eden ancak kanser tanısı almayan Medikare yararlanıcıları.

    Ana Çıktı Ölçümleri: Kolonoskopi ve sigmoidoskopi kullanımındaki eğilimler, kanser olmayan Medikare yararlanıcıları arasında çok değişkenli Poisson regresyonu ile değerlendirildi. Kanserli hastalarda, evre erken (evre I) ile tüm diğer evreler (II-IV) olarak sınıflandırıldı. Zaman, dönem 1 (taramaya kapsama yok, 1992-1...
  • Loss: MultipleNegativesRankingLoss with these parameters:
    {
        "scale": 20.0,
        "similarity_fct": "cos_sim"
    }
    
nfcorpus-tr

nfcorpus-tr

  • Dataset: nfcorpus-tr at 22d1ef8
  • Size: 110,575 training samples
  • Columns: anchor and positive
  • Approximate statistics based on the first 1000 samples:
    anchor positive
    type string string
    details
    • min: 8 tokens
    • mean: 12.97 tokens
    • max: 18 tokens
    • min: 29 tokens
    • mean: 378.06 tokens
    • max: 512 tokens
  • Samples:
    anchor positive
    Memeli Kanser Hücreleri Kolesterolden Beslenir. Düşük yoğunluklu lipoprotein (LDL) reseptörlerinin içeriği, birincil meme kanserlerinden alınan dokularda belirlenmiş ve bilinen prognostik öneme sahip değişkenlerle karşılaştırılmıştır. Dondurulmuş tümör örnekleri seçilmiş ve 72 hastanın dokuları (bunlardan 32'si ölmüş) incelenmiştir. LDL reseptör içeriği, hayatta kalma süresi ile ters orantılı bir korelasyon göstermiştir. Çok değişkenli istatistiksel bir yöntemle yapılan analiz, axiller metastazın varlığı, östrojen ve LDL reseptörleri içeriği, tümör çapı ve DNA deseni gibi faktörlerin, hastaların hayatta kalma süresi konusunda prognostik değer taşıdığını göstermiştir. Meme kanseri hastalarında hayatta kalma süresini tahmin etmek için geliştirilmiş yöntemler, bireysel hastalar için tedavi seçiminin belirlenmesinde faydalı olabilir.
    Memeli Kanser Hücreleri Kolesterolden Beslenir. ARKA PLAN: Memurun en sık teşhis edilen kanseri, Amerika Birleşik Devletleri'nde kadınlar arasında meme kanseri. Meme kanseri riski ve hayatta kalma ile ilgili diyet faktörlerinin değerlendirilmesi için kapsamlı araştırmalar tamamlandı; ancak klinik çıkarımlar içeren bir özet rapor gerekiyor. Malzemeler ve YÖNTEMLER: Bu inceleme, diyet ile meme kanseri oluşumu, tekrarı, hayatta kalma ve ölümcüllüğü arasındaki mevcut epidemiyolojik ve klinik deneme kanıtlarını özetlemektedir. İnceleme, meme kanseri alt tiplerinde risk değerlendirmesi yapan yeni epidemiyolojik çalışmaları da içermektedir ve aynı zamanda meme kanseri riskini değiştirmeyi amaçlayan önceki ve devam eden diyet müdahale denemelerinin özetini sunmaktadır. SONUÇLAR: Mevcut literatür, düşük yağ ve yüksek lifli diyetlerin meme kanseri karşısında zayıf koruyucu olabileceğini, toplam enerji alımının ve alkolün ise pozitif bir ilişki gösterdiğini öne sürmektedir. Lif, muhtemelen östrojen modülasyonu yoluyla koruyucu olabilirken, mey...
    Memeli Kanser Hücreleri Kolesterolden Beslenir. Fitoestrojenler, estrojenlerle yapısal olarak benzer ve estrojenik/antiestrojenik özellikleri taklit ederek meme kanseri riskini etkileyebilirler. Batılı toplumlarda, tam tahıllar ve muhtemelen soya gıdaları fitoestrojenlerin zengin kaynaklarıdır. Alman menopoz sonrası kadınlarda yapılan bir nüfus tabanlı vaka-kontrol çalışması, fitoestrojen bakımından zengin gıdalar ve diyet lignanlarla meme kanseri riski arasındaki ilişkiyi değerlendirmek için kullanıldı. Diyet verileri, 2.884 vaka ve 5.509 kontrol için geçerli bir gıda sıklığı anketini kullanarak toplandı, bu anket fitoestrojen bakımından zengin gıdalar hakkında ek sorular içeriyordu. İlişkiler, koşullu lojistik regresyon kullanılarak değerlendirildi. Tüm analizler, ilgili risk ve karıştırıcı faktörler için ayarlandı. Politomlu lojistik regresyon analizi, estrojen reseptörü (ER) durumuna göre ilişkileri değerlendirmek için yapıldı. Soya fasulyesi, güneş çiçek tohumu ve kabak tohumu tüketiminin yüksek ve düşük seviyeleri, tüketilmeme...
  • Loss: MultipleNegativesRankingLoss with these parameters:
    {
        "scale": 20.0,
        "similarity_fct": "cos_sim"
    }
    
multinli-tr

multinli-tr

  • Dataset: multinli-tr at a700b72
  • Size: 392,702 training samples
  • Columns: premise, hypothesis, and label
  • Approximate statistics based on the first 1000 samples:
    premise hypothesis label
    type string string int
    details
    • min: 4 tokens
    • mean: 26.79 tokens
    • max: 159 tokens
    • min: 3 tokens
    • mean: 14.55 tokens
    • max: 56 tokens
    • 0: ~65.70%
    • 1: ~34.30%
  • Samples:
    premise hypothesis label
    Kavramsal olarak krem kaymağının iki temel boyutu vardır - ürün ve coğrafya. Ürün ve coğrafya krem kaymağını işe yarıyor. 0
    Mevsim boyunca ve sanırım senin seviyendeyken onları bir sonraki seviyeye düşürürsün. Eğer ebeveyn takımını çağırmaya karar verirlerse Braves üçlü A'dan birini çağırmaya karar verirlerse çifte bir adam onun yerine geçmeye gider ve bekar bir adam gelir. Eğer insanlar hatırlarsa, bir sonraki seviyeye düşersin. 1
    Numaramızdan biri talimatlarınızı birazdan yerine getirecektir. Ekibimin bir üyesi emirlerinizi büyük bir hassasiyetle yerine getirecektir. 1
  • Loss: SoftmaxLoss
snli-tr

snli-tr

  • Dataset: snli-tr at 63eb107
  • Size: 550,152 training samples
  • Columns: premise, hypothesis, and label
  • Approximate statistics based on the first 1000 samples:
    premise hypothesis label
    type string string int
    details
    • min: 6 tokens
    • mean: 17.7 tokens
    • max: 54 tokens
    • min: 4 tokens
    • mean: 10.61 tokens
    • max: 31 tokens
    • 0: ~66.60%
    • 1: ~33.40%
  • Samples:
    premise hypothesis label
    Attaki bir kişi, bozuk bir uçağın üzerinden atlar. Bir kişi atını yarışma için eğitiyor. 0
    Attaki bir kişi, bozuk bir uçağın üzerinden atlar. Bir kişi bir lokantada omlet sipariş ediyor. 0
    Attaki bir kişi, bozuk bir uçağın üzerinden atlar. Bir kişi açık havada, at üzerinde. 1
  • Loss: SoftmaxLoss
stsb-tr

stsb-tr

  • Dataset: stsb-tr at 3d2e87d
  • Size: 5,749 training samples
  • Columns: sentence1, sentence2, and score
  • Approximate statistics based on the first 1000 samples:
    sentence1 sentence2 score
    type string string float
    details
    • min: 5 tokens
    • mean: 9.9 tokens
    • max: 25 tokens
    • min: 6 tokens
    • mean: 9.86 tokens
    • max: 21 tokens
    • min: 0.0
    • mean: 2.23
    • max: 5.0
  • Samples:
    sentence1 sentence2 score
    Bir uçak kalkıyor. Bir hava uçağı kalkıyor. 5.0
    Bir adam büyük bir flüt çalıyor. Bir adam flüt çalıyor. 3.8
    Bir adam pizzanın üzerine rendelenmiş peynir seriyor. Bir adam pişmemiş bir pizzanın üzerine rendelenmiş peynir seriyor. 3.8
  • Loss: CoSENTLoss with these parameters:
    {
        "scale": 20.0,
        "similarity_fct": "pairwise_cos_sim"
    }
    
wmt16

wmt16

  • Dataset: wmt16 at 9fc4e73
  • Size: 205,756 training samples
  • Columns: anchor and positive
  • Approximate statistics based on the first 1000 samples:
    anchor positive
    type string string
    details
    • min: 6 tokens
    • mean: 35.55 tokens
    • max: 130 tokens
    • min: 8 tokens
    • mean: 46.88 tokens
    • max: 186 tokens
  • Samples:
    anchor positive
    Kosova'nın özelleştirme süreci büyüteç altında Kosovo's privatisation process is under scrutiny
    Kosova, tekrar eden şikayetler ışığında özelleştirme sürecini incelemeye alıyor. Kosovo is taking a hard look at its privatisation process in light of recurring complaints.
    Southeast European Times için Priştine'den Muhamet Brayşori'nin haberi -- 21/03/12 By Muhamet Brajshori for Southeast European Times in Pristina -- 21/03/12
  • Loss: MultipleNegativesRankingLoss with these parameters:
    {
        "scale": 20.0,
        "similarity_fct": "cos_sim"
    }
    

Evaluation Datasets

msmarco-tr

msmarco-tr

  • Dataset: msmarco-tr at f03d837
  • Size: 31,540 evaluation samples
  • Columns: anchor and positive
  • Approximate statistics based on the first 1000 samples:
    anchor positive
    type string string
    details
    • min: 4 tokens
    • mean: 9.88 tokens
    • max: 40 tokens
    • min: 12 tokens
    • mean: 82.48 tokens
    • max: 149 tokens
  • Samples:
    anchor positive
    Brian Patrick Carroll kimdir? Buckethead Biyografisi. Brian Patrick Carroll (13 Mayıs 1969 doğumlu), profesyonel olarak Buckethead olarak bilinen, birçok müzik türünde çalışmış Amerikalı gitarist ve çoklu enstrümantalist. 265 stüdyo albümü, dört özel sürüm ve bir EP yayınladı. Ayrıca diğer sanatçılar tarafından 50'den fazla albümde seslendirdi.
    zolpidem bir benzodiazepin Zolpidem (Ambien), imidazopiridin sınıfının bir benzodiazepin olmayan hipnotikidir. Bu ilaç, benzodiazepin omega-1 reseptörüne (seçici olmayan omega-1, 2 ve 3 reseptör alt tiplerine bağlanan diğer benzodiazepinlerin aksine) çok seçici bir şekilde bağlanır, klorür kanalının açılma sıklığını arttırır.
    roti'de kalori 1 porsiyon Roti Akdeniz Izgara Tavuk Roti'de 257 kalori vardır. Kalori dağılımı: %47 yağ, %0 karbonhidrat, %53 protein.
  • Loss: MultipleNegativesRankingLoss with these parameters:
    {
        "scale": 20.0,
        "similarity_fct": "cos_sim"
    }
    
fiqa-tr

fiqa-tr

  • Dataset: fiqa-tr at bbc9e91
  • Size: 1,238 evaluation samples
  • Columns: anchor and positive
  • Approximate statistics based on the first 1000 samples:
    anchor positive
    type string string
    details
    • min: 6 tokens
    • mean: 18.43 tokens
    • max: 48 tokens
    • min: 8 tokens
    • mean: 219.48 tokens
    • max: 512 tokens
  • Samples:
    anchor positive
    Bir geliri olmayan işletme için işletme giderlerini talep etmek. Evet, henüz herhangi bir gelir elde etmiyorsanız işletme indirimleri talep edebilirsiniz. Ancak öncelikle işletmeniz için hangi yapıyı tercih edeceğinize karar vermelisiniz. Ya bir Şirket Yapısı ya da Tek Sahiplik veya Ortaklık. Şirket Yapısı Eğer bir Şirket Yapısı (kurulumu daha pahalı olan) seçerseniz, indirimleri talep edebilirsiniz ancak geliriniz yok. Bu nedenle işletmeniz bir zarara uğrar ve bu zararı, işletmenizden elde ettiğiniz gelirin giderlerinizi aşana kadar devam ettirirsiniz. Bu zararlar şirketin içinde kalır ve gelecek gelir yıllarında kârlarınızı dengelemek için devralınabilir. Daha fazla bilgi için ATO - Şirket Vergi Zararları'na bakın. Tek Sahiplik veya Ortaklık Yapısı Eğer Tek Sahiplik veya Ortaklık olarak seçerseniz ve işletmeniz bir zarara uğrarsa, bu zararı diğer kaynaklardan elde ettiğiniz gelire karşı dengeleyip dengeleyemeyeceğinizi kontrol etmeniz gerekir. İşletmenizin diğer gelirinize karşı zararını dengelemek için aşağıdaki testlerden birini geçmeniz gerekir...
    Bir işletme kontrol hesabından başka bir işletme kontrol hesabına para aktarma. "Her iki işletme için ayrı dosyalar olmalıdır. Para transferi yapan işletme, QB dosyasında ""çeki yaz"" olmalıdır. Para alan işletme, QB dosyasında ""banka yatırımı"" yapmalıdır. (QB'de, ödemeyi ACH gibi başka bir yöntemle yaptığınızda bile, ""çeki yaz"" demeniz gerekir.) Hiçbir işletme, diğerinin banka hesaplarını açıkça temsil etmemelidir. Her iki tarafta da, ödemenin hangi başka hesaptan geldiği/gittiği konusunda sınıflandırmanız gerekecektir - Bunun doğru olup olmadığını bilmek için, parayı neden transfer ettiğinizi ve kitaplarınızı nasıl kurduğunuzu bilmeniz gerekir. Sanırım bu, burada uygun/mümkün olan konunun ötesindedir. Kişisel hesabınızdan işinize para aktarmak, muhtemelen ortaklık sermayesi demektir, eğer başka bir şey yoksa. Örneğin, S Corp'ta kendinize bir maaş ödemelisiniz. Eğer yanlışlıkla fazla öderseniz, o zaman kişisel hesabınızdan şirketi geri bir çek yazıp hatayı düzeltirsiniz. Bu ortaklık sermayesi değil, muhtemelen maaş ödemelerini takip eden başka bir hesaptaki b...
    İş/yatırım için ayrı bir banka hesabınız var mı, ama "iş hesabı" değil mi? "İş için ayrı bir kontrol hesabı açmak mantıklıdır. Gelir/giderlerinizi belgelemek daha basittir. Hesaba giren ve çıkan her doları açıklayabilirsiniz, bunlardan bazılarının işle alakasız olduğunu hatırlamanıza gerek kalmadan. Kredi birliği, ikinci bir kontrol hesabı açmama ve çeklerin üzerine istediğim herhangi bir ad koymama izin verdi. Bu, çeklerin üzerine adımın yazılması yerine daha iyi görünüyordu. Yatırımlar için ayrı bir kontrol hesabına ihtiyaç görmüyorum. Parayı, herhangi bir ücret olmayan ve hatta biraz faiz kazandırabilen ayrı bir tasarruf hesabında tutabilirsiniz. Ayda çok sayıda yatırım işlemi yapmadığınız sürece bu benim için işe yaradı. Bu şekilde IRA'ları ve 529 planlarını finanse ediyorum. Ayda 4-5 kez maaş alıyoruz, ancak her ay fonlara para gönderiyoruz. İşlem sayısı büyüdükçe bir iş hesabına ihtiyacınız olacak. Bankaya her seferinde onlarca çek yatırıyorsanız, banka sizi iş hesabına geçmeye yönlendirecektir."
  • Loss: MultipleNegativesRankingLoss with these parameters:
    {
        "scale": 20.0,
        "similarity_fct": "cos_sim"
    }
    
quora-tr

quora-tr

  • Dataset: quora-tr at 6e1eee1
  • Size: 7,626 evaluation samples
  • Columns: anchor and positive
  • Approximate statistics based on the first 1000 samples:
    anchor positive
    type string string
    details
    • min: 5 tokens
    • mean: 15.29 tokens
    • max: 45 tokens
    • min: 5 tokens
    • mean: 15.47 tokens
    • max: 47 tokens
  • Samples:
    anchor positive
    Quora'yı bir moderatörün gözünden nasıl görürsünüz? Quora web sitesi, Quora moderasyon üyelerine nasıl görünür?
    Nasıl hayatımın yapmam gereken farklı şeyler arasında seçim yapmamayı reddedebilirim? Hayatta birçok farklı şeyi takip etmek mümkün mü?
    Ben Affleck Batman'de Christian Bale'den daha parlak mıydı? Sizce, Batman performansında kim daha iyiydi: Christian Bale mi yoksa Ben Affleck mi?
  • Loss: MultipleNegativesRankingLoss with these parameters:
    {
        "scale": 20.0,
        "similarity_fct": "cos_sim"
    }
    
nfcorpus-tr

nfcorpus-tr

  • Dataset: nfcorpus-tr at 22d1ef8
  • Size: 11,385 evaluation samples
  • Columns: anchor and positive
  • Approximate statistics based on the first 1000 samples:
    anchor positive
    type string string
    details
    • min: 7 tokens
    • mean: 11.41 tokens
    • max: 20 tokens
    • min: 67 tokens
    • mean: 375.07 tokens
    • max: 512 tokens
  • Samples:
    anchor positive
    Derin Kızartılmış Gıdaların Kanser Yapabileceği Nedenler Arka plan: Akrilamid, insan plasentasını geçen yaygın bir diyetik maruziyettir. Muhtemel insan kanserojen olarak sınıflandırılır ve farelerde gelişimsel toksisite gözlemlenmiştir. Amaçlar: Bu çalışmada, akrilamid ön doğum maruziyeti ile doğum sonuçlarının ilişkilerini inceledik. Yöntemler: Akrilamidin ve metaboliti glisidamidin hemoglobin (Hb) adductları, 2006-2010 yılları arasında Danimarka, İngiltere, Yunanistan, Norveç ve İspanya'da işe alınan 1.101 tek çocuklu hamile kadınların kordon kanında (hamileliğin son aylarında birikmiş maruziyeti yansıtan) ölçüldü. Anne diyetleri, gıda sıklığı anketleri aracılığıyla tahmin edildi. Sonuçlar: Hem akrilamid hem de glisidamid Hb adductları, doğum ağırlığı ve baş çevresi için istatistiksel olarak anlamlı bir azalma ile ilişkiliydi. En yüksek ve en düşük çeyrekte akrilamid Hb adduct seviyeleri arasındaki tahmin edilen doğum ağırlığı farkı, gestasyonel yaş ve ülke ayarlamalarından sonra –132 g (95% CI: –207, –56) idi; baş çevresi için karşılık ge...
    Derin Kızartılmış Gıdaların Kanser Yapabileceği Nedenler İnsanlar, patates kızartması ve diğer yiyecekler yoluyla akrilamid (AA) maruziyeti, potansiyel bir sağlık endişesi olarak kabul edilmiştir. Burada, pişirme sıcaklığı ve süresi gibi iki en etkili faktöre dayalı istatistiksel bir doğrusal olmayan regresyon modeli kullanarak, patates kızartmalarında AA konsantrasyonlarını tahmin ettik. Tahmin modeli için R(2) değeri 0.83, geliştirilmiş modelin önemli ve geçerli olduğunu göstermektedir. Bu çalışmada yapılan patates kızartması tüketimi anket verileri ve sekiz farklı kızartma sıcaklığı-zaman şeması, lezzetli ve görsel açıdan çekici patates kızartmaları üretebildiği için, Monte Carlo simülasyon sonuçları, AA konsantrasyonunun 168 ppb'den yüksek olduğu takdirde, Taichung Şehri'ndeki 13-18 yaş arası ergenlerin tahmin edilen kanser riski, sadece bu sınırlı yaşam süresi göz önüne alındığında, hedef aşılan ömür boyu kanser riski (ELCR) değerini aşacaktır. AA alımıyla ilişkili kanser riskini azaltmak için, patates kızartmalarındaki AA seviyelerinin...
    Derin Kızartılmış Gıdaların Kanser Yapabileceği Nedenler ARKA PLAN: Yaygın olarak tüketilen gıdalar, örneğin patates kızartması, patates cipsi veya tahıllar gibi ürünlerde nispeten yüksek akrilamid konsantrasyonları, insan sağlığı için potansiyel bir risk oluşturabilir.

    HEDEF: Bu pilot çalışmanın amacı, kronik akrilamid içeren patates cipsi alımının oksidatif stres veya iltihapla olası bağlantısını araştırmaktı.

    Tasarım: 14 sağlıklı gönüllü (ortalama yaş: 35; 8 kadın ve 6 günde 20 sigaradan fazla sigara içen) 4 hafta boyunca günde 160 gram akrilamid içeren 157 mikrogram (düzeltilmiş) akrilamid içeren patates cipsi aldı.

    Sonuç: Çalışmanın tüm katılımlarında kan akrilamid-hemoglobin bağlarımında artış bulundu, ortalama 43.1 pmol/L(-1)/g(-1) hemoglobin (aralık: 27-76; P < 0.01) sigara içmeyenlerde ve 59.0 pmol/L(-1)/g(-1) hemoglobin (aralık: 43-132; P < 0.05) sigara içenlerde. Aynı zamanda, hem sigara içenlerde hem de sigara içmeyenlerde okside LDL, yüksek duyarlılık interleukin-6, yüksek duyarlılık C-reaktif protein ve gama-glutamiltransfer...
  • Loss: MultipleNegativesRankingLoss with these parameters:
    {
        "scale": 20.0,
        "similarity_fct": "cos_sim"
    }
    
snli-tr

snli-tr

  • Dataset: snli-tr at 63eb107
  • Size: 10,000 evaluation samples
  • Columns: premise, hypothesis, and label
  • Approximate statistics based on the first 1000 samples:
    premise hypothesis label
    type string string int
    details
    • min: 6 tokens
    • mean: 18.69 tokens
    • max: 53 tokens
    • min: 4 tokens
    • mean: 10.29 tokens
    • max: 30 tokens
    • 0: ~67.50%
    • 1: ~32.50%
  • Samples:
    premise hypothesis label
    Paketlere gitmek için tutunurken iki kadın kucaklaşıyor. Kız kardeşler sadece öğle yemeği yedikten sonra paketleri gitmek için tutarken elveda sarılıyorlar. 0
    Paketlere gitmek için tutunurken iki kadın kucaklaşıyor. İki kadın paket tutuyor. 1
    Paketlere gitmek için tutunurken iki kadın kucaklaşıyor. Adamlar bir şarküterinin dışında kavga ediyorlar. 0
  • Loss: SoftmaxLoss
xnli-tr

xnli-tr

  • Dataset: xnli-tr at 3a66bc8
  • Size: 2,490 evaluation samples
  • Columns: premise, hypothesis, and label
  • Approximate statistics based on the first 1000 samples:
    premise hypothesis label
    type string string int
    details
    • min: 6 tokens
    • mean: 22.57 tokens
    • max: 67 tokens
    • min: 5 tokens
    • mean: 13.12 tokens
    • max: 33 tokens
    • 0: ~66.70%
    • 1: ~33.30%
  • Samples:
    premise hypothesis label
    Ve Anne, evdeyim dedi. Okul servisi onu bırakır bırakmaz annesini aradı. 0
    Ve Anne, evdeyim dedi. Bir kelime söylemedi. 0
    Ve Anne, evdeyim dedi. Annesine eve gittiğini söyledi. 1
  • Loss: SoftmaxLoss
stsb-tr

stsb-tr

  • Dataset: stsb-tr at 3d2e87d
  • Size: 1,500 evaluation samples
  • Columns: sentence1, sentence2, and score
  • Approximate statistics based on the first 1000 samples:
    sentence1 sentence2 score
    type string string float
    details
    • min: 5 tokens
    • mean: 15.37 tokens
    • max: 58 tokens
    • min: 5 tokens
    • mean: 15.41 tokens
    • max: 54 tokens
    • min: 0.0
    • mean: 2.1
    • max: 5.0
  • Samples:
    sentence1 sentence2 score
    Kasklı bir adam dans ediyor. Baret giyen bir adam dans ediyor. 5.0
    Küçük bir çocuk ata biniyor. Bir çocuk ata biniyor. 4.75
    Bir adam fareyi yılana besliyor. Adam yılana fare besliyor. 5.0
  • Loss: CoSENTLoss with these parameters:
    {
        "scale": 20.0,
        "similarity_fct": "pairwise_cos_sim"
    }
    
wmt16

wmt16

  • Dataset: wmt16 at 9fc4e73
  • Size: 1,001 evaluation samples
  • Columns: anchor and positive
  • Approximate statistics based on the first 1000 samples:
    anchor positive
    type string string
    details
    • min: 4 tokens
    • mean: 26.96 tokens
    • max: 149 tokens
    • min: 4 tokens
    • mean: 39.33 tokens
    • max: 240 tokens
  • Samples:
    anchor positive
    Norveç'in rakfisk'i: Dünyanın en kokulu balığı bu mu? Norway's rakfisk: Is this the world's smelliest fish?
    Norveç'in beş milyon insanı en yüksek yaşam standartlarının tadını çıkarıyor, sadece Avrupa'da değil, dünyada. Norway's five million people enjoy one of the highest standards of living, not just in Europe, but in the world.
    Ülkenin başarısının sırrı aşırı kokulu bazı balıklara olan yerel iştahla bağlantılı olabilir mi? Could the secret of the country's success be connected to the local appetite for some exceedingly smelly fish?
  • Loss: MultipleNegativesRankingLoss with these parameters:
    {
        "scale": 20.0,
        "similarity_fct": "cos_sim"
    }
    

Training Hyperparameters

Non-Default Hyperparameters

  • eval_strategy: steps
  • per_device_train_batch_size: 64
  • per_device_eval_batch_size: 64
  • learning_rate: 2e-05
  • num_train_epochs: 1
  • warmup_ratio: 0.1
  • fp16: True
  • batch_sampler: no_duplicates

All Hyperparameters

Click to expand
  • overwrite_output_dir: False
  • do_predict: False
  • eval_strategy: steps
  • prediction_loss_only: True
  • per_device_train_batch_size: 64
  • per_device_eval_batch_size: 64
  • per_gpu_train_batch_size: None
  • per_gpu_eval_batch_size: None
  • gradient_accumulation_steps: 1
  • eval_accumulation_steps: None
  • torch_empty_cache_steps: None
  • learning_rate: 2e-05
  • weight_decay: 0.0
  • adam_beta1: 0.9
  • adam_beta2: 0.999
  • adam_epsilon: 1e-08
  • max_grad_norm: 1.0
  • num_train_epochs: 1
  • max_steps: -1
  • lr_scheduler_type: linear
  • lr_scheduler_kwargs: {}
  • warmup_ratio: 0.1
  • warmup_steps: 0
  • log_level: passive
  • log_level_replica: warning
  • log_on_each_node: True
  • logging_nan_inf_filter: True
  • save_safetensors: True
  • save_on_each_node: False
  • save_only_model: False
  • restore_callback_states_from_checkpoint: False
  • no_cuda: False
  • use_cpu: False
  • use_mps_device: False
  • seed: 42
  • data_seed: None
  • jit_mode_eval: False
  • use_ipex: False
  • bf16: False
  • fp16: True
  • fp16_opt_level: O1
  • half_precision_backend: auto
  • bf16_full_eval: False
  • fp16_full_eval: False
  • tf32: None
  • local_rank: 0
  • ddp_backend: None
  • tpu_num_cores: None
  • tpu_metrics_debug: False
  • debug: []
  • dataloader_drop_last: False
  • dataloader_num_workers: 0
  • dataloader_prefetch_factor: None
  • past_index: -1
  • disable_tqdm: False
  • remove_unused_columns: True
  • label_names: None
  • load_best_model_at_end: False
  • ignore_data_skip: False
  • fsdp: []
  • fsdp_min_num_params: 0
  • fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
  • fsdp_transformer_layer_cls_to_wrap: None
  • accelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
  • deepspeed: None
  • label_smoothing_factor: 0.0
  • optim: adamw_torch
  • optim_args: None
  • adafactor: False
  • group_by_length: False
  • length_column_name: length
  • ddp_find_unused_parameters: None
  • ddp_bucket_cap_mb: None
  • ddp_broadcast_buffers: False
  • dataloader_pin_memory: True
  • dataloader_persistent_workers: False
  • skip_memory_metrics: True
  • use_legacy_prediction_loop: False
  • push_to_hub: False
  • resume_from_checkpoint: None
  • hub_model_id: None
  • hub_strategy: every_save
  • hub_private_repo: None
  • hub_always_push: False
  • gradient_checkpointing: False
  • gradient_checkpointing_kwargs: None
  • include_inputs_for_metrics: False
  • include_for_metrics: []
  • eval_do_concat_batches: True
  • fp16_backend: auto
  • push_to_hub_model_id: None
  • push_to_hub_organization: None
  • mp_parameters:
  • auto_find_batch_size: False
  • full_determinism: False
  • torchdynamo: None
  • ray_scope: last
  • ddp_timeout: 1800
  • torch_compile: False
  • torch_compile_backend: None
  • torch_compile_mode: None
  • dispatch_batches: None
  • split_batches: None
  • include_tokens_per_second: False
  • include_num_input_tokens_seen: False
  • neftune_noise_alpha: None
  • optim_target_modules: None
  • batch_eval_metrics: False
  • eval_on_start: False
  • use_liger_kernel: False
  • eval_use_gather_object: False
  • average_tokens_across_devices: False
  • prompts: None
  • batch_sampler: no_duplicates
  • multi_dataset_batch_sampler: proportional

Training Logs

Epoch Step Training Loss msmarco-tr loss fiqa-tr loss quora-tr loss nfcorpus-tr loss snli-tr loss xnli-tr loss stsb-tr loss wmt16 loss stsb-tr_spearman_cosine snli-tr_cosine_ap xnli-tr_cosine_ap wmt16_cosine_ap msmarco-tr_cosine_ap fiqa-tr_cosine_ap quora-tr_cosine_ap nfcorpus-tr_cosine_ap
0.0209 500 1.1414 0.2698 1.9305 0.1019 1.1507 0.5826 0.6343 11.1465 0.9888 0.7727 0.4918 0.4731 1.0 1.0 1.0 1.0 1.0
0.0417 1000 0.8222 0.2270 1.8603 0.0904 1.0909 0.4977 0.5921 11.8077 0.6025 0.7783 0.4928 0.5208 1.0 1.0 1.0 1.0 1.0
0.0626 1500 0.7991 0.1968 1.7750 0.0879 1.0778 0.4483 0.5314 12.2621 0.5532 0.7865 0.5174 0.5560 1.0 1.0 1.0 1.0 1.0
0.0835 2000 0.7775 0.1903 1.7956 0.0809 1.0444 0.4053 0.4841 12.3953 0.5244 0.7909 0.5311 0.5875 1.0 1.0 1.0 1.0 1.0
0.1043 2500 0.6397 0.1779 1.7774 0.0772 1.0337 0.3985 0.4661 11.9094 0.4421 0.7853 0.5702 0.5917 1.0 1.0 1.0 1.0 1.0
0.1252 3000 0.7237 0.1658 1.6839 0.0768 1.0342 0.3646 0.4684 12.1233 0.3539 0.8049 0.5745 0.5949 1.0 1.0 1.0 1.0 1.0
0.1461 3500 0.5485 0.1603 1.7514 0.0811 1.0235 0.3626 0.4589 12.7109 0.2967 0.7867 0.5985 0.6128 1.0 1.0 1.0 1.0 1.0
0.1669 4000 0.6076 0.1513 1.6503 0.0723 1.0043 0.3555 0.4829 12.5178 0.2867 0.8049 0.5692 0.6019 1.0 1.0 1.0 1.0 1.0
0.1878 4500 0.5363 0.1478 1.6573 0.0696 1.0147 0.3448 0.4759 12.7022 0.2406 0.8042 0.5886 0.6023 1.0 1.0 1.0 1.0 1.0
0.2087 5000 0.5543 0.1453 1.6171 0.0664 1.0054 0.3384 0.4634 12.3955 0.2647 0.8116 0.5896 0.6107 1.0 1.0 1.0 1.0 1.0
0.2295 5500 0.6203 0.1455 1.6107 0.0710 0.9872 0.3333 0.4487 12.1924 0.2382 0.8110 0.5837 0.6206 1.0 1.0 1.0 1.0 1.0
0.2504 6000 0.6368 0.1354 1.5559 0.0704 1.0105 0.3236 0.4455 12.4101 0.2259 0.8102 0.5998 0.6200 1.0 1.0 1.0 1.0 1.0
0.2713 6500 0.568 0.1366 1.5891 0.0701 0.9898 0.3206 0.4292 11.9028 0.2035 0.8066 0.5866 0.6038 1.0 1.0 1.0 1.0 1.0
0.2921 7000 0.6087 0.1300 1.5420 0.0671 0.9914 0.3175 0.4247 12.2175 0.2220 0.8112 0.5902 0.6183 1.0 1.0 1.0 1.0 1.0
0.3130 7500 0.5987 0.1233 1.5577 0.0622 0.9914 0.3205 0.4559 12.4562 0.1855 0.8126 0.6083 0.6184 1.0 1.0 1.0 1.0 1.0
0.3339 8000 0.5158 0.1231 1.5156 0.0653 0.9854 0.3145 0.4436 12.3801 0.1826 0.8107 0.6016 0.6073 1.0 1.0 1.0 1.0 1.0
0.3547 8500 0.5475 0.1208 1.4804 0.0631 0.9754 0.3140 0.4662 12.8113 0.1841 0.8152 0.5904 0.6142 1.0 1.0 1.0 1.0 1.0
0.3756 9000 0.638 0.1270 1.5346 0.0652 0.9691 0.3112 0.4162 12.2037 0.1964 0.8092 0.6004 0.6281 1.0 1.0 1.0 1.0 1.0
0.3965 9500 0.594 0.1203 1.4953 0.0637 0.9715 0.3152 0.4756 12.7237 0.1561 0.8068 0.6040 0.6185 1.0 1.0 1.0 1.0 1.0
0.4173 10000 0.5815 0.1169 1.4600 0.0595 0.9748 0.3115 0.4733 12.7256 0.1669 0.8101 0.6085 0.6156 1.0 1.0 1.0 1.0 1.0
0.4382 10500 0.6099 0.1168 1.4518 0.0667 0.9748 0.3025 0.4319 12.5545 0.1821 0.8183 0.6135 0.6232 1.0 1.0 1.0 1.0 1.0
0.4591 11000 0.5243 0.1152 1.4609 0.0636 0.9691 0.3086 0.4409 12.5561 0.1717 0.8120 0.6114 0.6269 1.0 1.0 1.0 1.0 1.0
0.4799 11500 0.5788 0.1149 1.4629 0.0629 0.9603 0.3007 0.4444 12.4325 0.1740 0.8137 0.6077 0.6266 1.0 1.0 1.0 1.0 1.0
0.5008 12000 0.4322 0.1116 1.4600 0.0623 0.9684 0.2992 0.4232 12.5360 0.1757 0.8160 0.6045 0.6234 1.0 1.0 1.0 1.0 1.0
0.5217 12500 0.6227 0.1106 1.4774 0.0635 0.9649 0.2966 0.4272 12.3037 0.1568 0.8193 0.6061 0.6220 1.0 1.0 1.0 1.0 1.0
0.5425 13000 0.5269 0.1087 1.4653 0.0627 0.9646 0.2946 0.4262 12.4239 0.1672 0.8172 0.6154 0.6240 1.0 1.0 1.0 1.0 1.0
0.5634 13500 0.5462 0.1076 1.4482 0.0613 0.9608 0.2950 0.4061 12.3639 0.1669 0.8134 0.6289 0.6340 1.0 1.0000 1.0 1.0 1.0
0.5843 14000 0.5737 0.1069 1.4330 0.0594 0.9715 0.2934 0.4241 12.5838 0.1553 0.8162 0.6060 0.6201 1.0 1.0 1.0 1.0 1.0
0.6052 14500 0.5542 0.1062 1.4318 0.0630 0.9627 0.2936 0.4252 12.4879 0.1537 0.8135 0.6182 0.6211 1.0 1.0 1.0 1.0 1.0
0.6260 15000 0.4828 0.1014 1.4022 0.0620 0.9721 0.2916 0.4162 12.5052 0.1578 0.8200 0.6130 0.6307 1.0 1.0 1.0 1.0 1.0
0.6469 15500 0.585 0.1030 1.4268 0.0662 0.9565 0.2915 0.4235 12.4999 0.1483 0.8166 0.5973 0.6245 1.0 1.0 1.0 1.0 1.0
0.6678 16000 0.5699 0.1036 1.4218 0.0636 0.9622 0.2883 0.4099 12.4195 0.1516 0.8182 0.6130 0.6315 1.0 1.0 1.0 1.0 1.0
0.6886 16500 0.5372 0.1003 1.4122 0.0619 0.9671 0.2905 0.4249 12.5527 0.1545 0.8164 0.6119 0.6304 1.0 1.0 1.0 1.0 1.0
0.7095 17000 0.5473 0.1021 1.4109 0.0636 0.9602 0.2848 0.4097 12.3792 0.1640 0.8157 0.6171 0.6351 1.0 1.0 1.0 1.0 1.0
0.7304 17500 0.5665 0.0985 1.3868 0.0604 0.9616 0.2845 0.4083 12.4513 0.1523 0.8195 0.6044 0.6306 1.0 1.0 1.0 1.0 1.0
0.7512 18000 0.498 0.0985 1.3925 0.0606 0.9605 0.2828 0.4068 12.4254 0.1544 0.8177 0.6082 0.6351 1.0 1.0 1.0 1.0 1.0
0.7721 18500 0.5037 0.0975 1.3748 0.0570 0.9619 0.2891 0.4256 12.5656 0.1451 0.8158 0.6072 0.6294 1.0 1.0 1.0 1.0 1.0
0.7930 19000 0.4885 0.0966 1.3742 0.0612 0.9600 0.2818 0.3993 12.4406 0.1473 0.8170 0.6096 0.6349 1.0 1.0 1.0 1.0 1.0
0.8138 19500 0.5042 0.0966 1.3817 0.0589 0.9621 0.2822 0.4181 12.5854 0.1476 0.8167 0.6186 0.6418 1.0 1.0 1.0 1.0 1.0
0.8347 20000 0.5453 0.0966 1.3790 0.0583 0.9553 0.2824 0.4112 12.5904 0.1451 0.8156 0.6100 0.6336 1.0 1.0 1.0 1.0 1.0
0.8556 20500 0.5351 0.0963 1.3810 0.0591 0.9588 0.2844 0.4211 12.7160 0.1445 0.8161 0.6129 0.6358 1.0 1.0 1.0 1.0 1.0
0.8764 21000 0.4601 0.0951 1.3744 0.0581 0.9573 0.2792 0.4059 12.5846 0.1448 0.8156 0.6193 0.6372 1.0 1.0 1.0 1.0 1.0
0.8973 21500 0.4698 0.0949 1.3757 0.0578 0.9576 0.2780 0.4020 12.6457 0.1417 0.8146 0.6180 0.6347 1.0 1.0000 1.0 1.0 1.0
0.9182 22000 0.4838 0.0930 1.3611 0.0564 0.9572 0.2781 0.4136 12.7198 0.1404 0.8157 0.6187 0.6348 1.0 1.0 1.0 1.0 1.0
0.9390 22500 0.5106 0.0931 1.3639 0.0569 0.9550 0.2791 0.4117 12.6323 0.1377 0.8168 0.6121 0.6328 1.0 1.0 1.0 1.0 1.0
0.9599 23000 0.6039 0.0929 1.3606 0.0568 0.9566 0.2797 0.4182 12.6569 0.1339 0.8167 0.6130 0.6332 1.0 1.0 1.0 1.0 1.0
0.9808 23500 0.5395 0.0928 1.3603 0.0575 0.9553 0.2783 0.4120 12.6136 0.1337 0.8168 0.6132 0.6338 1.0 1.0 1.0 1.0 1.0

Framework Versions

  • Python: 3.11.11
  • Sentence Transformers: 3.4.1
  • Transformers: 4.49.0
  • PyTorch: 2.6.0+cu124
  • Accelerate: 1.5.2
  • Datasets: 3.4.1
  • Tokenizers: 0.21.1

Citation

BibTeX

Sentence Transformers and SoftmaxLoss

@inproceedings{reimers-2019-sentence-bert,
    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
    author = "Reimers, Nils and Gurevych, Iryna",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
    month = "11",
    year = "2019",
    publisher = "Association for Computational Linguistics",
    url = "https://arxiv.org/abs/1908.10084",
}

MultipleNegativesRankingLoss

@misc{henderson2017efficient,
    title={Efficient Natural Language Response Suggestion for Smart Reply},
    author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
    year={2017},
    eprint={1705.00652},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}

CoSENTLoss

@online{kexuefm-8847,
    title={CoSENT: A more efficient sentence vector scheme than Sentence-BERT},
    author={Su Jianlin},
    year={2022},
    month={Jan},
    url={https://kexue.fm/archives/8847},
}
Downloads last month
2
Safetensors
Model size
111M params
Tensor type
F32
·
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for selmanbaysan/berturk-base_fine_tuned

Datasets used to train selmanbaysan/berturk-base_fine_tuned

Evaluation results