Commits · amd-shark/sdxl-quant-int8

QKV fused and all linear layers sym

5d000b6
verified

GiusFra commited on Jul 16, 2024

QKV fused and sym

f20a0bf
verified

GiusFra commited on Jul 16, 2024

QKV fused and sym

881d80b
verified

GiusFra commited on Jul 16, 2024

Full symmetric

ed4e81d
verified

GiusFra commited on Jul 15, 2024

Full symmetric

1e690df
verified

GiusFra commited on Jul 15, 2024

QKV fused and all linear layers sym

3cee2a6
verified

GiusFra commited on Jul 14, 2024

QKV fused and all linear layers sym

cf48f0f
verified

GiusFra commited on Jul 14, 2024

QKV fused and sym

6f44cfb
verified

GiusFra commited on Jul 13, 2024

QKV fused and sym

b175bf6
verified

GiusFra commited on Jul 13, 2024

Fused QKV quant_params.json with zp

7e99883
verified

GiusFra commited on Jul 11, 2024

Added vae weights with FP16 fix.

2de7ba8

nickfraser commited on Jul 11, 2024

Fused QKV safetensor with zp

0339659
verified

GiusFra commited on Jul 11, 2024

Fused QKV safetensor

348012d
verified

GiusFra commited on Jul 10, 2024

Fused QKV quant_params.json

a793c5a
verified

GiusFra commited on Jul 10, 2024

Fix model loading

7f81513
verified

GiusFra commited on Jul 9, 2024

Updates to minimal quantization script. (#1)

72eb84b
verified

GiusFra

nickfraser commited on Jul 9, 2024

Update quant params structure (#2)

6b62ce4
verified

nickfraser commited on Jul 3, 2024

Reference inputs

17638f5
verified

GiusFra commited on Jul 2, 2024

Updated quant_params

fb3aa3b
verified

GiusFra commited on Jul 2, 2024

Updated params.safetensors

36c8b73
verified

GiusFra commited on Jul 2, 2024

Output reference tensors

6e61570
verified

GiusFra commited on Jul 2, 2024

Quantization script

ecec5b7
verified

GiusFra commited on Jun 21, 2024

Remove potential overflow / saturation error.

161df88

nickfraser commited on Jun 19, 2024

Added comments - highlight possible overflow situation

3f5851c

nickfraser commited on Jun 19, 2024

Updated math model to target int8 x int8 kernels.

4024f9d

nickfraser commited on Jun 19, 2024

Updated QOp model to fuse SmoothQuant scales with input quantization

dca9b6e

nickfraser commited on Jun 18, 2024

Output reference tensors

8e3c05a
verified

GiusFra commited on Jun 14, 2024

Add config.json from stable-diffusion-xl-base-1.0/unet

54be8be

Stella Laurenzo commited on Jun 12, 2024

Upload params.safetensors with huggingface_hub

1dad0d1
verified

GiusFra commited on Jun 12, 2024

add missing smoothquant factors

99e9d19
verified

GiusFra commited on Jun 12, 2024

update quant_params with correct shapes

d6a388a
verified

GiusFra commited on Jun 11, 2024

Fix: set `keepdim=True`

9ab1060

nickfraser commited on Jun 11, 2024

[test] Fixed shapes to match new `quant_param.json`

673c9f2

nickfraser commited on Jun 11, 2024