zaebuc-cefr / README.md
balhafni's picture
Update README.md
d585afd verified
metadata
license: mit
language:
  - ar
base_model: CAMeL-Lab/bert-base-arabic-camelbert-msa
pipeline_tag: text-classification

Arabic CEFR Essay Scoring Model

This model is a text classification model to predict the CEFR levels of Modern Standard Arabic (MSA) essays. The model is built by fine-tuning CAMeLBEBT-MSA on the ZAEBUC dataset. For now, the model can predict the following CEFR levels: A2, B1, B2, C1.

from transformers import pipeline

cefr_model = pipeline('text-classification', 'balhafni/zaebuc-cefr')

text = ("تعد وسائل التواصل الاجتماعي من اكبر المؤثرات على الفرد في مجتمعنا الحالي , "
        "وذلك بسبب ادمان الفرد على استخدامها بشكل متواصل ويومي . تتنوع المؤثرات منها "
        "الايجابية والسلبية على الافراد في دولتنا , الايجابية منها سرعة التواصل و سهولته "
        "وتنوعها كالرسائل الفورية والصوتية والتواصلل المرئي و الصوتي . ايضا يمكن للفائدة ان "
        "تشمل الناس عامة في وظائفهم من خلال تمكنهم من استخدما البريد الالكتروني والاجتماعات "
        "خلال هذه الوسائل . ومن السلبيات التي تنتج من وسائل التواصل الاجتماعي الابتزاز "
        "الالكتروني وهي ظاهرة منتشرة في الآوانه الاخيرة وغير ذلك اضاعة الوقت الذي يمكن "
        "استثمارة بفائدة اخرى ومن امثلة اضاعة الوقت قضاء وقت العمل على وسائل التواصل "
        "الاجتماعي لإضاعته . ومن مؤثرات الوسائل على المجتمع ان تنتشر الاشاعات التي تولد "
        "وتزيد من المشاكل ومنها المشاكل الاسرية والاجتماعية والسياسية وغيرها . "
        "وعلى سبيل التأثير الايجابي من الممكن ان تنتشر التوعية في بعض المجالات "
        "على المجتمع خلال وسائل التواصل , ايضا من الممكن ان تنتشر بعض الثقافات "
        "الايجابية على المجتمع من خلال وسائل التواصل كالقراءة .")


cefr_pred = cefr_model(text)
print(cefr_pred)

# [{'label': 'B2', 'score': 0.9653089046478271}]