Spaces:

ubermenchh
/

arxiv-retrieval

Build error

ubermenchh commited on Oct 26, 2023

Commit

6390543

1 Parent(s): fe97892

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -60,6 +60,7 @@ for i in range(0, len(data), batch_size):
     index.upsert(vectors=zip(ids, embeds, metadata))
 model_id = 'meta-llama/Llama-2-7b-chat-hf'
 bnb_config = transformers.BitsAndBytesConfig(
     load_in_4bit=True,
@@ -67,17 +68,18 @@ bnb_config = transformers.BitsAndBytesConfig(
     bnb_4bit_use_double_quant=True,
     bnb_4bit_compute_dtype=bfloat16
 )
-model_config = transformers.AutoConfig.from_pretrained(model_id)
 model = transformers.AutoModelForCausalLM.from_pretrained(
     model_id,
     trust_remote_code=True,
     config=model_config,
     quantization_config=bnb_config,
-    device_map='auto'
 )
 model.eval()
-tokenizer = transformer.AutoTokenizer.from_pretrained(model_id)
 generate_text = transformers.pipeline(
     model=model,

     index.upsert(vectors=zip(ids, embeds, metadata))
 model_id = 'meta-llama/Llama-2-7b-chat-hf'
+hf_auth = os.environ.get('HF_AUTH_KEY')
 bnb_config = transformers.BitsAndBytesConfig(
     load_in_4bit=True,
     bnb_4bit_use_double_quant=True,
     bnb_4bit_compute_dtype=bfloat16
 )
+model_config = transformers.AutoConfig.from_pretrained(model_id, use_auth_token=hf_auth)
 model = transformers.AutoModelForCausalLM.from_pretrained(
     model_id,
     trust_remote_code=True,
     config=model_config,
     quantization_config=bnb_config,
+    device_map='auto',
+    use_auth_token=hf_auth
 )
 model.eval()
+tokenizer = transformer.AutoTokenizer.from_pretrained(model_id, use_auth_token=hf_auth)
 generate_text = transformers.pipeline(
     model=model,