--- license: mit language: - fr tags: - Objectifs de développement durable (ODD) - SDG - BERT Classification --- # ilovebots/bert-sdg-french Ce modèle permet de classer les textes en fonction des objectifs de développement durable (ODD) des Nations Unies. image Source: [https://www.un.org/development/desa/disabilities/about-us/sustainable-development-goals-sdgs-and-disability.html](https://www.un.org/development/desa/disabilities/about-us/sustainable-development-goals-sdgs-and-disability.html) ## Détails du modèle ### Description du modèle Ce modèle de classification de texte a été développé en fine-tuning le modèle pré-entraîné dbmdz/bert-base-french-europeana-cased. Les données d'entraînement de ce modèle affiné proviennent de l'ensemble de données communautaires OSDG (OSDG-CD) accessible au public à l'adresse https://zenodo.org/record/5550238#.ZBulfcJByF4. Ce modèle a été réalisé dans le cadre d'une recherche universitaire à l'[Université Laval](https://www.ulaval.ca/developpement-durable/objectifs-de-developpement-durable-de-lonu).
L'objectif était de créer un modèle de classification de texte SDG basé sur transformers en français.
Les principaux détails du modèle sont mis en évidence ci-dessous : - **Model type:** Text classification - **Language(s) (NLP):** French - **License:** mit - **Finetuned from model :** dbmdz/bert-base-french-europeana-cased ### Model Sources - **Repository:** https://huggingface.co/ilovebots/bert-sdg-french ## How to Get Started with the Model Utilisez le code ci-dessous pour commencer à utiliser le modèle. ```python from transformers import AutoTokenizer, AutoModelForSequenceClassification tokenizer = AutoTokenizer.from_pretrained("ilovebots/bert-sdg-french") model = AutoModelForSequenceClassification.from_pretrained("ilovebots/bert-sdg-french") ``` ## Training Data La base disponible dans https://zenodo.org/record/5550238#.ZBulfcJByF4 a été enrichie des objectifs de développement durable des Nations Unies et traduite en en français. ## Training Hyperparameters - Num_epoch = 4 - Learning rate = 2e-5 - Epsilon = 1e-8 - Optimizer = AdamW - Batch size = 32 - Seed random = 42 ## Evaluation #### Metrics - Accuracy = 0.84 image ## Citation Martinez, D.F. (2023). SDG classification with BERT. https://huggingface.co/ilovebots/bert-sdg-french