l3cube-pune's picture
Update README.md
6e8248a verified
metadata
language: mr
tags:
  - bert
license: cc-by-4.0
datasets:
  - L3Cube-MahaNews-LPC
widget:
  - text: >-
      भारत आणि आयर्लंड यांच्यात तीन कसोटी सामन्यांची मालिका खेळवण्यात येणार आहे.
      या मालिकेसाठी भारतीय संघात तीन खेळाडूंना पदार्पण करण्याची संधी मिळणार
      असल्याचे समोर येत आहे. तीन खेळाडू आहेत ज्यांना पदार्पणाची संधी मिळू शकते.
      यामध्ये प्रसिद्ध कृष्णा, रिंकू सिंग आणि जितेश शर्मा यांचा समावेश आहे.

MahaNews-All-BERT

MahaNews-All-BERT is a MahaBERT(l3cube-pune/marathi-bert-v2) model fine-tuned on full L3Cube-MahaNews-All Corpus, a Marathi document classification dataset.
It is a topic identification cum document classification model with 12 output categories. The model is trained on combined MahaNews-LPC (long doc), MahaNews-SHC (short text), and MahaNews-LPC (medium paragraphs)
[dataset link] (https://github.com/l3cube-pune/MarathiNLP)

More details on the dataset, models, and baseline results can be found in our [paper] (coming soon)
Citing:

@inproceedings{mittal2023l3cube,
  title={L3Cube-MahaNews: News-Based Short Text and Long Document Classification Datasets in Marathi},
  author={Mittal, Saloni and Magdum, Vidula and Hiwarkhedkar, Sharayu and Dhekane, Omkar and Joshi, Raviraj},
  booktitle={International Conference on Speech and Language Technologies for Low-resource Languages},
  pages={52--63},
  year={2023},
  organization={Springer}
}

Other Marathi Sentiment models from MahaNews family are shared here:

MahaNews-LDC-BERT (long documents)
MahaNews-SHC-BERT (short text)
MahaNews-LPC-BERT (medium paragraphs)
MahaNews-All-BERT (all document lengths)