File size: 1,200 Bytes
29e729b
dd86c3d
 
 
 
 
 
 
 
 
 
 
 
 
 
7d7305d
dd86c3d
 
7d7305d
dd86c3d
 
 
7d7305d
 
 
29e729b
 
dd86c3d
29e729b
dd86c3d
 
 
 
 
29e729b
dd86c3d
29e729b
dd86c3d
 
 
 
29e729b
dd86c3d
29e729b
dd86c3d
 
 
 
29e729b
dd86c3d
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
---
language: en
tags:
- musr
- question-answering
- reasoning
metrics:
- accuracy: 0.87
- reasoning_quality: 1.0
- source_integration: 0.975
datasets:
- allenai/qasc
model-index:
- name: Qwen-0.5B-MUSR
  results:
  - task:
      type: question-answering
      name: Multi-Source Reasoning (MUSR)
    dataset:
      name: QASC
      type: allenai/qasc
    metrics:
    - type: accuracy
      value: 0.87
      name: Accuracy
---

# Qwen-0.5B-MUSR

Ce modèle est une version fine-tunée de Qwen-0.5B optimisée pour le benchmark MUSR, atteignant :
- Une amélioration de 40.52% de l'eval_loss par rapport à la baseline
- Une accuracy de 87% sur les questions multi-sources
- Une qualité de raisonnement parfaite (100%)
- Une utilisation quasi-parfaite des sources (97.5%)

## Performances

- Accuracy: 0.87
- Reasoning Quality: 1.0
- Source Integration: 0.975
- Eval Loss: 1.036

## Cas d'utilisation

Particulièrement efficace pour :
- Questions nécessitant l'intégration de multiples sources
- Raisonnement complexe
- Réponses explicatives détaillées

## Configuration optimale :
- max_length: 170
- weight_decay: 0.1
- warmup_ratio: 0.07
- gradient_accumulation: 4
- scheduler: polynomial