legmlai
/

legml-v0.1

Safetensors

French

qwen2

Eval Results

Model card Files Files and versions Community

malhajar commited on Nov 26, 2024

Commit

f9a37ef

verified ·

1 Parent(s): 931524f

Update README.md

Browse files

Files changed (1) hide show

README.md +40 -27

README.md CHANGED Viewed

@@ -90,25 +90,26 @@ model-index:
       name: accuracy
 ---
 <img src="https://path.to/your/legml-image.png" alt="LegML-v0.1" width="500"/>
 # LegML-v0.1
-LegML-v0.1 est un modèle de langage de grande taille (LLM) en français, doté de multiples capacités couvrant divers domaines tels que la programmation, les mathématiques et bien d'autres. Ce modèle est une version améliorée d'un LLM basé sur Qwen, spécialement adapté pour le français. Il a été entraîné sur un ensemble de données français soigneusement nettoyé et annoté pour exécuter des instructions en français de manière précise et organisée.
-L'entraînement du modèle a été intensif, effectué sur 4 GPU A100 pendant deux jours, en utilisant ce jeu de données spécialisé pour optimiser ses performances.
 ## Détails du Modèle
-- **Modèle de Base** : LLM Qwen-2.5 de 14 milliards de paramètres
-- **Jeu de Données d'Entraînement** : Ensemble de données français annoté et nettoyé
-- **Méthode d'Entraînement** : Affinage complet et exhaustif
 ## Exemples d'Utilisation
 ```python
 from transformers import AutoModelForCausalLM, AutoTokenizer
-device = "cuda"  # l'appareil sur lequel charger le modèle
 model_name = "VotreNomUtilisateur/LegML-v0.1"
 model = AutoModelForCausalLM.from_pretrained(
@@ -118,11 +119,11 @@ model = AutoModelForCausalLM.from_pretrained(
 )
 tokenizer = AutoTokenizer.from_pretrained(model_name)
-prompt = "Comment afficher 'Bonjour le monde' en Python ?"
 messages = [
     {
         "role": "system",
-        "content": "Vous êtes une intelligence artificielle assistante créée par LegAI, conçue pour suivre les instructions données et fournir les meilleures réponses possibles."
     },
     {
         "role": "user",
@@ -138,11 +139,11 @@ model_inputs = tokenizer([text], return_tensors="pt").to(device)
 generated_ids = model.generate(
     model_inputs.input_ids,
-    temperature=0.3,
-    top_k=50,
-    top_p=0.9,
     max_new_tokens=512,
-    repetition_penalty=1.0,
 )
 generated_ids = [
     output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
@@ -156,43 +157,54 @@ print(response)
 ### Exemple 1
-**Invite :**
 ```
-Comment les institutions financières en France gèrent-elles les risques de sécurité des données associés à l'intelligence artificielle ? Pouvez-vous donner trois exemples ?
 ```
 **Réponse :**
-Les institutions financières en France gèrent les risques de sécurité des données liés à l'intelligence artificielle (IA) par plusieurs approches :
-1. **Implémentation de Protocoles de Chiffrement Avancés** : Elles utilisent des méthodes de chiffrement robustes comme AES ou RSA pour protéger les informations sensibles des clients contre tout accès non autorisé.
-2. **Déploiement de Systèmes de Détection d'Anomalies Basés sur l'IA** : Ces systèmes surveillent les transactions en temps réel pour identifier des comportements inhabituels, aidant ainsi à prévenir la fraude et les cyberattaques.
-3. **Conformité Réglementaire et Formation du Personnel** : Les institutions s'assurent de respecter les réglementations telles que le RGPD et investissent dans la formation continue de leur personnel sur les meilleures pratiques en matière de sécurité des données.
 ### Exemple 2
-**Invite :**
 ```
-Comment afficher "Bonjour le monde" en Python ?
 ```
 **Réponse :**
-Pour afficher "Bonjour le monde" en Python, vous pouvez utiliser la fonction \`print()\`. Voici comment procéder :
-```python
-print("Bonjour le monde")
-```
-En exécutant ce code, le texte "Bonjour le monde" sera affiché à l'écran. La fonction \`print()\` est utilisée pour afficher des messages ou des variables en sortie.
 ## Résultats de l'Évaluation
-Les performances de LegML-v0.1 ont été évaluées sur plusieurs benchmarks en français. Voici les résultats obtenus :
 | Benchmark          | Métrique               | Valeur (%) |
 |--------------------|------------------------|-----------:|
@@ -202,5 +214,6 @@ Les performances de LegML-v0.1 ont été évaluées sur plusieurs benchmarks en
 | **MUSR-fr**        | Précision normalisée   |      9.93% |
 | **MATH-lvl5-fr**   | Correspondance exacte  |     22.27% |
 | **MMMLU-fr**       | Précision              |     68.31% |
-Ces résultats reflètent les capacités du modèle sur une variété de tâches complexes en français, tout en soulignant les domaines où des améliorations sont possibles.

       name: accuracy
 ---
+<img src="https://path.to/your/legml-image.png" alt="LegML-v0.1" width="500"/>
 <img src="https://path.to/your/legml-image.png" alt="LegML-v0.1" width="500"/>
 # LegML-v0.1
+LegML-v0.1 est un grand modèle de langage (LLM) en français, capable de gérer une multitude de tâches telles que la programmation, les mathématiques, et bien d'autres domaines. Ce modèle est une version étendue d'un LLM basé sur Qwen, optimisé spécifiquement pour le français. Il a été entraîné sur un vaste corpus de données françaises nettoyées et annotées avec soin pour exécuter des instructions en français avec précision et cohérence.
+L'entraînement intensif a été réalisé sur 4 GPU A100 pendant une durée de deux jours, utilisant cet ensemble de données spécialisé pour améliorer ses performances globales.
 ## Détails du Modèle
+- **Modèle de Base** : Qwen-2.5 LLM avec 14 milliards de paramètres
+- **Données d'Entraînement** : Corpus français annoté et nettoyé
+- **Méthode d'Entraînement** : Affinage complet approfondi
 ## Exemples d'Utilisation
 ```python
 from transformers import AutoModelForCausalLM, AutoTokenizer
+device = "cuda"  # Appareil sur lequel charger le modèle
 model_name = "VotreNomUtilisateur/LegML-v0.1"
 model = AutoModelForCausalLM.from_pretrained(
 )
 tokenizer = AutoTokenizer.from_pretrained(model_name)
+prompt = "Expliquez les principes fondamentaux de la théorie de la relativité restreinte."
 messages = [
     {
         "role": "system",
+        "content": "Vous êtes un assistant virtuel compétent, prêt à fournir des réponses claires et détaillées aux questions posées."
     },
     {
         "role": "user",
 generated_ids = model.generate(
     model_inputs.input_ids,
+    temperature=0.5,
+    top_k=40,
+    top_p=0.8,
     max_new_tokens=512,
+    repetition_penalty=1.05,
 )
 generated_ids = [
     output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
 ### Exemple 1
+**Question :**
 ```
+Expliquez les principes fondamentaux de la théorie de la relativité restreinte.
 ```
 **Réponse :**
+La théorie de la relativité restreinte, proposée par Albert Einstein en 1905, repose sur deux principes fondamentaux :
+1. **Principe de Relativité** : Les lois de la physique sont les mêmes dans tous les référentiels inertiels, c'est-à-dire pour tous les observateurs en mouvement rectiligne uniforme les uns par rapport aux autres.
+2. **Invariance de la Vitesse de la Lumière** : La vitesse de la lumière dans le vide est constante et indépendante du mouvement de la source ou de l'observateur, soit approximativement \( c = 299\,792\,458 \) mètres par seconde.
+Ces principes entraînent des conséquences majeures, telles que la dilatation du temps, la contraction des longueurs et l'équivalence masse-énergie exprimée par la célèbre formule \( E = mc^2 \).
 ### Exemple 2
+**Question :**
 ```
+Comment installer une bibliothèque externe en Python, par exemple NumPy ?
 ```
 **Réponse :**
+Pour installer une bibliothèque externe en Python comme NumPy, vous pouvez utiliser le gestionnaire de packages \`pip\`. Voici comment faire :
+1. **Ouvrez le terminal ou l'invite de commande** de votre système.
+2. **Exécutez la commande suivante** :
+   ```bash
+   pip install numpy
+   ```
+3. **Vérifiez l'installation** en important la bibliothèque dans un script Python :
+   ```python
+   import numpy as np
+   print(np.__version__)
+   ```
+Cette commande installera NumPy sur votre système, et vous pourrez l'utiliser dans vos scripts pour des calculs scientifiques et mathématiques.
 ## Résultats de l'Évaluation
+Les performances de LegML-v0.1 ont été évaluées sur divers benchmarks en français. Voici les résultats obtenus :
 | Benchmark          | Métrique               | Valeur (%) |
 |--------------------|------------------------|-----------:|
 | **MUSR-fr**        | Précision normalisée   |      9.93% |
 | **MATH-lvl5-fr**   | Correspondance exacte  |     22.27% |
 | **MMMLU-fr**       | Précision              |     68.31% |
+| **Moyenne**        |                        |     28.81% |
+Ces résultats démontrent les capacités du modèle sur une gamme variée de tâches complexes en français, tout en indiquant les domaines où des améliorations peuvent être apportées.