AngelPanizo's picture
Add BERTopic model
51b7002 verified
metadata
tags:
  - bertopic
library_name: bertopic
pipeline_tag: text-classification

MARTINI_enrich_BERTopic_mha_haber

This is a BERTopic model. BERTopic is a flexible and modular topic modeling framework that allows for the generation of easily interpretable topics from large datasets.

Usage

To use this model, please install BERTopic:

pip install -U bertopic

You can use the model as follows:

from bertopic import BERTopic
topic_model = BERTopic.load("AIDA-UPM/MARTINI_enrich_BERTopic_mha_haber")

topic_model.get_topic_info()

Topic overview

  • Number of topics: 88
  • Number of training documents: 14958
Click here for an overview of all topics.
Topic ID Topic Keywords Topic Frequency Label
-1 erdogan - bakanlıgı - kılıcdaroglu - ankara - istanbul 20 -1_erdogan_bakanlıgı_kılıcdaroglu_ankara
0 erdogan - kıbrıs - okmeydanı - cıkacagız - ansızın 9763 0_erdogan_kıbrıs_okmeydanı_cıkacagız
1 afganistanlı - karzai - taliban - gazeteci - kadınlarına 278 1_afganistanlı_karzai_taliban_gazeteci
2 seviyorsunuz - kızımız - yapmazdım - bakarsın - aglamayın 150 2_seviyorsunuz_kızımız_yapmazdım_bakarsın
3 galatasaray - futbolcunun - sampiyonlar - federasyonu - takımımızın 143 3_galatasaray_futbolcunun_sampiyonlar_federasyonu
4 cıkarıldıgı - sanlıurfa - kızını - zanlısı - yasemin 142 4_cıkarıldıgı_sanlıurfa_kızını_zanlısı
5 diyarbakır - dokunulmazlıgının - cumhuriyet - hatırasına - baslattı 136 5_diyarbakır_dokunulmazlıgının_cumhuriyet_hatırasına
6 istanbul - ihtiyacına - karaismailoglu - sukranlarımı - baskanımıza 135 6_istanbul_ihtiyacına_karaismailoglu_sukranlarımı
7 akademisyenler - dekanı - rektoru - kampuslerinde - cakıroglu 133 7_akademisyenler_dekanı_rektoru_kampuslerinde
8 ataturkumuzden - cumhuriyetimizin - kahramanlarımızı - canakkale - bagımsızlıgımızın 130 8_ataturkumuzden_cumhuriyetimizin_kahramanlarımızı_canakkale
9 kılıcdaroglu - partiyi - yapmadılar - kaybettirmek - ayırıyorum 129 9_kılıcdaroglu_partiyi_yapmadılar_kaybettirmek
10 luhansk - kherson - ukraynalı - andriy - tankını 125 10_luhansk_kherson_ukraynalı_andriy
11 azerbaycanlı - haciyev - ermenistanın - bayramov - bagımsızlıgıdır 122 11_azerbaycanlı_haciyev_ermenistanın_bayramov
12 hayvanların - koyunlarını - hayvancılık - barınagında - veterinerde 114 12_hayvanların_koyunlarını_hayvancılık_barınagında
13 polisin - karsılastı - departmanı - memurları - tabancasıyla 113 13_polisin_karsılastı_departmanı_memurları
14 bıcakladıgı - taksicilik - carpması - havalı - trafikte 99 14_bıcakladıgı_taksicilik_carpması_havalı
15 gokbilimciler - yıldızları - nasa - jupiter - hawking 96 15_gokbilimciler_yıldızları_nasa_jupiter
16 kılıcdaroglu - milliyeciyiz - belediyelerimiz - aylıgı - bagımsızlıgınızı 95 16_kılıcdaroglu_milliyeciyiz_belediyelerimiz_aylıgı
17 cıkabilecek - kurulusları - sehirlerarası - sınırlandırılacak - yılbasında 93 17_cıkabilecek_kurulusları_sehirlerarası_sınırlandırılacak
18 devletimizin - hurriyetleri - olusturamayacagımızı - fedakarlıgıyla - cumhurbaskanımızın 92 18_devletimizin_hurriyetleri_olusturamayacagımızı_fedakarlıgıyla
19 bankacıyı - yatırılan - hesabına - banknotları - kiracısının 87 19_bankacıyı_yatırılan_hesabına_banknotları
20 ırkcıyım - bırakmayalım - mansur - ankara - evlatlarımızı 87 20_ırkcıyım_bırakmayalım_mansur_ankara
21 koronavirusten - kovid - karantinaya - varolmadıgını - enfeksiyonunu 87 21_koronavirusten_kovid_karantinaya_varolmadıgını
22 bitfinex - yatırımcılar - borsasının - dolarlık - btcturk 86 22_bitfinex_yatırımcılar_borsasının_dolarlık
23 tweet - sosyal - cezalandırılma - kullanıcıları - tagını 82 23_tweet_sosyal_cezalandırılma_kullanıcıları
24 kılıcdaroglu - elektrifikasyonu - faturasını - doyuracagım - calısırsanız 82 24_kılıcdaroglu_elektrifikasyonu_faturasını_doyuracagım
25 zelenskiy - ukraynalı - kiev - rusya - sıgınaklardan 79 25_zelenskiy_ukraynalı_kiev_rusya
26 buyuksehir - cumhubaskanlıgımız - taksiciler - mecidiyekoy - metrobus 74 26_buyuksehir_cumhubaskanlıgımız_taksiciler_mecidiyekoy
27 sınavları - okullarımızı - baslatılabilmesi - kurumları - actıgımızda 71 27_sınavları_okullarımızı_baslatılabilmesi_kurumları
28 bayraktar - teknisyenlerinin - havacılık - sanayisi - baslayacagımızın 70 28_bayraktar_teknisyenlerinin_havacılık_sanayisi
29 israili - basbakanı - hamas - netanyahu - bombalanacagını 67 29_israili_basbakanı_hamas_netanyahu
30 haytaoglu - antalya - ayrılmadıgı - avukatını - balayını 65 30_haytaoglu_antalya_ayrılmadıgı_avukatını
31 fiyatı - urunlerinin - harcları - 2022 - yumurta 60 31_fiyatı_urunlerinin_harcları_2022
32 marmaris - denizaltılar - pınarlık - harmanlı - imara 59 32_marmaris_denizaltılar_pınarlık_harmanlı
33 pfizer - covishield - koronavirusun - sinovac - asısının 58 33_pfizer_covishield_koronavirusun_sinovac
34 israilli - kızılayı - evlerinizde - filistinlilerin - yaramıyor 56 34_israilli_kızılayı_evlerinizde_filistinlilerin
35 kurultayımızı - partisi - demokrasicilik - kazanamayacagını - sancılı 53 35_kurultayımızı_partisi_demokrasicilik_kazanamayacagını
36 hastalıgın - calısanlarımızın - hekimlerimiz - cokmeyecegini - basarısızlıgının 53 36_hastalıgın_calısanlarımızın_hekimlerimiz_cokmeyecegini
37 benzin - fiyatı - motorinli - lpg - litresinde 53 37_benzin_fiyatı_motorinli_lpg
38 kadınları - ozgurluklerin - kavusacagız - kısırlastırılmıstı - hakları 52 38_kadınları_ozgurluklerin_kavusacagız_kısırlastırılmıstı
39 havayolları - helikopterler - pilotu - parcalanmasın - kazasında 48 39_havayolları_helikopterler_pilotu_parcalanmasın
40 gazetecilerin - basbakanıma - hazırdım - saygısızlık - ombudsmanı 46 40_gazetecilerin_basbakanıma_hazırdım_saygısızlık
41 turkistanlıların - uygulanmasındaki - dısisleri - soykırımı - alıkoydugunu 44 41_turkistanlıların_uygulanmasındaki_dısisleri_soykırımı
42 bankası - lirasının - tcmb - dolar - calıstırıyordunuz 43 42_bankası_lirasının_tcmb_dolar
43 trump - biden - sayımının - partisiyiz - melania 42 43_trump_biden_sayımının_partisiyiz
44 kanalı - televizyon - oscarları - tv100 - hizmetlerinizi 41 44_kanalı_televizyon_oscarları_tv100
45 bankamızın - yatırımcısının - cagrımdır - rezervlerini - basekonomisti 41 45_bankamızın_yatırımcısının_cagrımdır_rezervlerini
46 whatsapp - mesajlarınızın - gizlilik - kullanıcılar - instagram 40 46_whatsapp_mesajlarınızın_gizlilik_kullanıcılar
47 putin - ukrayna - nato - yaptırımlarımız - demokrasilerin 40 47_putin_ukrayna_nato_yaptırımlarımız
48 nato - stoltenberg - denizde - anlasmazlıklarımızın - politikalarımızla 38 48_nato_stoltenberg_denizde_anlasmazlıklarımızın
49 akıncı - partiye - cumhurbaskanlıgı - siyasilerin - onaylayanların 37 49_akıncı_partiye_cumhurbaskanlıgı_siyasilerin
50 arkeologlar - kopekbalıklarının - mumyanın - canavarına - hominin 37 50_arkeologlar_kopekbalıklarının_mumyanın_canavarına
51 eskisehir - sakarya - gaziantep - kahramanmaras - kaymakamlarının 37 51_eskisehir_sakarya_gaziantep_kahramanmaras
52 doktorların - kapatılmadıgı - ilgileniyordu - sehir - zulmedilmis 35 52_doktorların_kapatılmadıgı_ilgileniyordu_sehir
53 altıncay - telbisoglu - sokak - sanliurfa - apartmanı 33 53_altıncay_telbisoglu_sokak_sanliurfa
54 musk - twitter - tesla - yatırımıyla - tikleri 32 54_musk_twitter_tesla_yatırımıyla
55 harekatları - operasyonuyla - teroristlerle - patlayıcının - komandolarımızın 32 55_harekatları_operasyonuyla_teroristlerle_patlayıcının
56 sonlandırılmıstır - yıkayabilecegi - karsılayamayanlar - suriyelilerden - kabinleri 32 56_sonlandırılmıstır_yıkayabilecegi_karsılayamayanlar_suriyelilerden
57 muftulukler - namazını - cıkaracaklarını - imam - bayram 32 57_muftulukler_namazını_cıkaracaklarını_imam
58 sorumluluklarımızı - suleyman - televizyonlarımız - turkmenlerine - cocuklarıyız 31 58_sorumluluklarımızı_suleyman_televizyonlarımız_turkmenlerine
59 pradesh - bhopal - kıpırdamasıyla - bjp - bengal 30 59_pradesh_bhopal_kıpırdamasıyla_bjp
60 turistleri - turistlermis - asılanacakmıs - yurtdısındaki - gidebilirsiniz 30 60_turistleri_turistlermis_asılanacakmıs_yurtdısındaki
61 saydıgını - milliyetciligi - ilkelerimizi - cıkarmayacaklarını - ittikafımızın 29 61_saydıgını_milliyetciligi_ilkelerimizi_cıkarmayacaklarını
62 mercedes - otomobillerinin - volkswagen - fabrikamız - renault 29 62_mercedes_otomobillerinin_volkswagen_fabrikamız
63 yılın - milyarlık - yatırımlarının - gelirlerinde - rekortmenleri 28 63_yılın_milyarlık_yatırımlarının_gelirlerinde
64 lgbti - ozgurluklerini - milliyetcilikten - hazırlayacagımız - sapkınlıga 28 64_lgbti_ozgurluklerini_milliyetcilikten_hazırlayacagımız
65 cezasına - carptırılmasını - hırsızlıktan - sevgilisini - kuzenlerin 28 65_cezasına_carptırılmasını_hırsızlıktan_sevgilisini
66 ukrayna - putin - hazırladıgımız - bogazlarının - saldırmayacagız 28 66_ukrayna_putin_hazırladıgımız_bogazlarının
67 biden - amerikalılara - kamala - senatorleri - kaldırdıgını 27 67_biden_amerikalılara_kamala_senatorleri
68 kovid - hastalıgım - basımızda - turkucu - hocalarımızın 27 68_kovid_hastalıgım_basımızda_turkucu
69 kaydıgı - sıgacık - buyuklugundeki - volkanik - topraklarla 26 69_kaydıgı_sıgacık_buyuklugundeki_volkanik
70 sahıslara - afganistan - pakistanlı - sıgınmacılardan - kızı 26 70_sahıslara_afganistan_pakistanlı_sıgınmacılardan
71 netanyahu - hamas - filistinlileri - antisemtizmi - hasımları 26 71_netanyahu_hamas_filistinlileri_antisemtizmi
72 tiktok - takipcilerinden - kolaylastırdınız - yapamazsınız - giremeyecegiz 25 72_tiktok_takipcilerinden_kolaylastırdınız_yapamazsınız
73 bankaları - eczacıbası - calısanlarımızı - etiketlerdeki - yatırıyoruz 25 73_bankaları_eczacıbası_calısanlarımızı_etiketlerdeki
74 yayınlayacagım - gaznelilerin - yaratmıstır - izleyebilirsiniz - videoyu 25 74_yayınlayacagım_gaznelilerin_yaratmıstır_izleyebilirsiniz
75 hamas - haaretz - yitzhak - hazırlandık - barbarlıgını 24 75_hamas_haaretz_yitzhak_hazırlandık
76 ankaralılar - mansur - kalkanımızla - destekcisiyim - yatırıldıgını 24 76_ankaralılar_mansur_kalkanımızla_destekcisiyim
77 kaynaklar - millienerjideyenimujde - gazın - yapılmayacagını - muhendislerimizin 24 77_kaynaklar_millienerjideyenimujde_gazın_yapılmayacagını
78 cavusoglu - mitsotakis - farklılıklarımız - tasarımcısı - devletleri 24 78_cavusoglu_mitsotakis_farklılıklarımız_tasarımcısı
79 konserlerini - uzaklastırıldıgını - imamlık - muzisyenler - alınmamasını 23 79_konserlerini_uzaklastırıldıgını_imamlık_muzisyenler
80 arabistan - imamı - suudi - yemen - kasıkcı 23 80_arabistan_imamı_suudi_yemen
81 japonlar - akasaki - yoshinori - moriwaki - ulasabileceklerini 23 81_japonlar_akasaki_yoshinori_moriwaki
82 twitch - dolandırıcılıgına - youtuberlarından - toprakcı - skandalı 23 82_twitch_dolandırıcılıgına_youtuberlarından_toprakcı
83 alısverisinde - kartında - kullanılıp - tartısmayın - marketi 22 83_alısverisinde_kartında_kullanılıp_tartısmayın
84 putin - basayev - atacagımızı - anlamıyorsunuz - bırakmanın 21 84_putin_basayev_atacagımızı_anlamıyorsunuz
85 irak - harekatında - kuzeyindeki - bombaladı - noktaları 20 85_irak_harekatında_kuzeyindeki_bombaladı
86 ksenobotlar - robot - bırakılabiliyor - neuralink - implantın 20 86_ksenobotlar_robot_bırakılabiliyor_neuralink

Training hyperparameters

  • calculate_probabilities: True
  • language: None
  • low_memory: False
  • min_topic_size: 10
  • n_gram_range: (1, 1)
  • nr_topics: None
  • seed_topic_list: None
  • top_n_words: 10
  • verbose: False
  • zeroshot_min_similarity: 0.7
  • zeroshot_topic_list: None

Framework versions

  • Numpy: 1.26.4
  • HDBSCAN: 0.8.40
  • UMAP: 0.5.7
  • Pandas: 2.2.3
  • Scikit-Learn: 1.5.2
  • Sentence-transformers: 3.3.1
  • Transformers: 4.46.3
  • Numba: 0.60.0
  • Plotly: 5.24.1
  • Python: 3.10.12