l3cube-pune's picture
Update README.md
a5d6902 verified
metadata
language: mr
tags:
  - bert
license: cc-by-4.0
datasets:
  - L3Cube-MahaNews-LPC
widget:
  - text: >-
      भारत आणि आयर्लंड यांच्यात तीन कसोटी सामन्यांची मालिका खेळवण्यात येणार आहे.
      या मालिकेसाठी भारतीय संघात तीन खेळाडूंना पदार्पण करण्याची संधी मिळणार
      असल्याचे समोर येत आहे. तीन खेळाडू आहेत ज्यांना पदार्पणाची संधी मिळू शकते.
      यामध्ये प्रसिद्ध कृष्णा, रिंकू सिंग आणि जितेश शर्मा यांचा समावेश आहे.

MahaNews-LPC-BERT

MahaNews-LPC-BERT is a MahaBERT(l3cube-pune/marathi-bert-v2) model fine-tuned on full L3Cube-MahaNews-LPC Corpus, a Marathi medium document / paragraph classification dataset.
It is a topic identification cum medium paragraph classification model with 12 output categories
[dataset link] (https://github.com/l3cube-pune/MarathiNLP)

More details on the dataset, models, and baseline results can be found in our [paper] (coming soon)
Citing:

@inproceedings{mittal2023l3cube,
  title={L3Cube-MahaNews: News-Based Short Text and Long Document Classification Datasets in Marathi},
  author={Mittal, Saloni and Magdum, Vidula and Hiwarkhedkar, Sharayu and Dhekane, Omkar and Joshi, Raviraj},
  booktitle={International Conference on Speech and Language Technologies for Low-resource Languages},
  pages={52--63},
  year={2023},
  organization={Springer}
}

Other Marathi Sentiment models from MahaNews family are shared here:

MahaNews-LDC-BERT (long documents)
MahaNews-SHC-BERT (short text)
MahaNews-LPC-BERT (medium paragraphs)
MahaNews-All-BERT (all document lengths)