neuralmagic
/

TinyLlama-1.1B-Chat-v1.0-marlin

Text Generation

text-generation-inference

Inference Endpoints

4-bit precision

Model card Files Files and versions Community

TinyLlama-1.1B-Chat-v1.0-marlin

Commit History

Update quantization/apply_gptq_save_marlin.py

29715d8
verified

robertgshaw2 commited on Mar 6

Update README.md

29e8c23
verified

robertgshaw2 commited on Mar 6

Create requirements.txt

c7713ac
verified

robertgshaw2 commited on Mar 6

Create quantization/apply_gptq_save_marlin.py

9d40424
verified

robertgshaw2 commited on Mar 6

Update README.md

bd74ab9
verified

robertgshaw2 commited on Mar 6

Create README.md

8680e42
verified

robertgshaw2 commited on Mar 6

Upload folder using huggingface_hub

5059cf5
verified

mgoin commited on Mar 5

initial commit

15de72b
verified

mgoin commited on Mar 5