File size: 1,200 Bytes
29e729b dd86c3d 7d7305d dd86c3d 7d7305d dd86c3d 7d7305d 29e729b dd86c3d 29e729b dd86c3d 29e729b dd86c3d 29e729b dd86c3d 29e729b dd86c3d 29e729b dd86c3d 29e729b dd86c3d |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 |
---
language: en
tags:
- musr
- question-answering
- reasoning
metrics:
- accuracy: 0.87
- reasoning_quality: 1.0
- source_integration: 0.975
datasets:
- allenai/qasc
model-index:
- name: Qwen-0.5B-MUSR
results:
- task:
type: question-answering
name: Multi-Source Reasoning (MUSR)
dataset:
name: QASC
type: allenai/qasc
metrics:
- type: accuracy
value: 0.87
name: Accuracy
---
# Qwen-0.5B-MUSR
Ce modèle est une version fine-tunée de Qwen-0.5B optimisée pour le benchmark MUSR, atteignant :
- Une amélioration de 40.52% de l'eval_loss par rapport à la baseline
- Une accuracy de 87% sur les questions multi-sources
- Une qualité de raisonnement parfaite (100%)
- Une utilisation quasi-parfaite des sources (97.5%)
## Performances
- Accuracy: 0.87
- Reasoning Quality: 1.0
- Source Integration: 0.975
- Eval Loss: 1.036
## Cas d'utilisation
Particulièrement efficace pour :
- Questions nécessitant l'intégration de multiples sources
- Raisonnement complexe
- Réponses explicatives détaillées
## Configuration optimale :
- max_length: 170
- weight_decay: 0.1
- warmup_ratio: 0.07
- gradient_accumulation: 4
- scheduler: polynomial
|