Data type : F32 vs BF16

by GuillaumeGrosjean - opened Nov 30, 2024

Discussion

GuillaumeGrosjean

Nov 30, 2024

•

edited Nov 30, 2024

Le modèle d'origine Qwen2.5-14B est entraîné en BF16.
legml-v0.1 est disponible en FP32.

Y a-t-il un risque de perte de performance en chargeant legml-v0.1 en FP16 / BF16 ?
Y a-t-il une raison matérielle ou de performance qui explique de repasser à FP32 pour l'entraînement de legml-v0.1 ?

konilse

Dec 2, 2024

Je me faisais la même remarque. Et au-delà du format, il manque le benchmark FR de Qwen2.5-14B-instruct pour pouvoir vraiment le comparer à legml-v0.1 ...

Orbina-development

Dec 2, 2024

This comment has been hidden

malhajar

legml.ai org Dec 2, 2024

@GuillaumeGrosjean Merci pour cette observation. Nous en avons tenu compte et nous intégrerons le support du fp16 dans les versions futures.

malhajar changed discussion status to closed Dec 2, 2024

malhajar

legml.ai org Dec 2, 2024

@konilse Nous avons essayé de rattraper notre retard dans les évaluations. Cependant, les récents retards sont dus à un manque de GPU que l'on nous a promis de résoudre au cours de cette semaine.

Upload images, audio, and videos by dragging in the text input, pasting, or clicking here.

Tap or paste here to upload images

Your need to confirm your account before you can post a new comment.

· Sign up or log in to comment