Spaces:

kidwaiaun
/

HRT

Paused

kidwaiaun commited on Feb 17

Commit

162e1ec

verified ·

1 Parent(s): bb332e6

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -25,7 +25,7 @@ model = AutoModelForCausalLM.from_pretrained(
     model_name,
     quantization_config=quantization_config,
     device_map="auto",
-    max_memory={0: "22GiB", "cpu": "6GiB"}  # Prevent VRAM overflow
 )
 text_generator = pipeline("text-generation", model=model, tokenizer=tokenizer)

     model_name,
     quantization_config=quantization_config,
     device_map="auto",
+    max_memory={0: "22GiB", "cpu": "6GiB"}  # Prevent VRAM overflow
 )
 text_generator = pipeline("text-generation", model=model, tokenizer=tokenizer)