Spaces:

Subodh358
/

NeuralRootsAI

Runtime error

Subodh358 commited on Jul 8

Commit

74792b5

•

1 Parent(s): 6cf611e

Upload 3 files

Files changed (2) hide show

Dockerfile CHANGED Viewed

@@ -11,33 +11,3 @@ RUN pip install --no-cache-dir --upgrade -r requirements.txt
 COPY --chown=user . /app
 CMD ["uvicorn", "main:app", "--host", "0.0.0.0", "--port", "7860"]
-# FROM python:3.9
-# # Set environment variables
-# ENV MODEL_NAME="meta-llama/Meta-Llama-3-8B-Instruct"
-# ENV TRANSFORMERS_CACHE="/app/transformers_cache"
-# ENV LC_ALL=C.UTF-8
-# ENV LANG=C.UTF-8
-# # Install additional dependencies if needed
-# RUN pip install --no-cache-dir fastapi uvicorn
-# # Create the app directory and set permissions
-# RUN mkdir /app && chmod -R 777 /app
-# # Set the working directory
-# WORKDIR /app
-# # Copy your model and code to the container
-# COPY ./app.py /app
-# COPY ./Dockerfile /app
-# COPY ./requirements.txt /app
-# # Expose the port FastAPI will run on
-# EXPOSE 8000
-# # Run FastAPI server
-# CMD ["uvicorn", "app:app", "--host", "0.0.0.0", "--port", "8000"]


11
12	COPY --chown=user . /app
13	CMD ["uvicorn", "main:app", "--host", "0.0.0.0", "--port", "7860"]

main.py CHANGED Viewed

@@ -1,12 +1,16 @@
 from fastapi import FastAPI, HTTPException
 from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline
 app = FastAPI()
-# Load model and tokenizer
 model_name = "meta-llama/Meta-Llama-3-8B-Instruct"
-tokenizer = AutoTokenizer.from_pretrained(model_name)
-model = AutoModelForCausalLM.from_pretrained(model_name)
 generator = pipeline("text-generation", model=model, tokenizer=tokenizer)
 @app.get("/")

 from fastapi import FastAPI, HTTPException
 from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline
+import os
 app = FastAPI()
+# Hugging Face authentication token
+hf_token = os.getenv("HF_TOKEN")
+# Load model and tokenizer with the authentication token
 model_name = "meta-llama/Meta-Llama-3-8B-Instruct"
+tokenizer = AutoTokenizer.from_pretrained(model_name, use_auth_token=hf_token)
+model = AutoModelForCausalLM.from_pretrained(model_name, use_auth_token=hf_token)
 generator = pipeline("text-generation", model=model, tokenizer=tokenizer)
 @app.get("/")