OPEA
/

DeepSeek-R1-int2-mixed-sym-inc

intel/auto-round

Model card Files Files and versions Community

cicdatopea commited on 12 days ago

Commit

1b5913e

·

verified ·

1 Parent(s): e691dc8

fix cuda inference code

Files changed (1) hide show

README.md +2 -0

README.md CHANGED Viewed

@@ -25,6 +25,8 @@ please note int2 **may be slower** than int4 on CUDA due to kernel issue.
 ~~~python
 import transformers
 from transformers import AutoModelForCausalLM, AutoTokenizer
 #  https://github.com/huggingface/transformers/pull/35493
 def set_initialized_submodules(model, state_dict_keys):

 ~~~python
 import transformers
 from transformers import AutoModelForCausalLM, AutoTokenizer
+from auto_round import AutoRoundConfig ##must import for auto-round format
 #  https://github.com/huggingface/transformers/pull/35493
 def set_initialized_submodules(model, state_dict_keys):