nfunctor
/

SuperNova-Medius-FP8-Dynamic

Text Generation

text-generation-inference

compressed-tensors

Model card Files Files and versions

SuperNova-Medius-FP8-Dynamic

This is a FP8-quantized version of arcee-ai/SuperNova-Medius using the llmcompressor library.

For more information about the quantization method, please visit FP8 documentation used for quantization.

Downloads last month: 9

Safetensors

Model size

15B params

Tensor type

BF16

·

F8_E4M3

·

Model tree for nfunctor/SuperNova-Medius-FP8-Dynamic

Base model

Qwen/Qwen2.5-14B

Finetuned

arcee-ai/SuperNova-Medius

Quantized

(17)

this model