Spaces:

ryanpdwyer
/

instruction-tuning

Build error

ryanpdwyer commited on Sep 20, 2024

Commit

951d064

1 Parent(s): 3c111ba

Switched to optimum.nvidia

Files changed (2) hide show

app.py CHANGED Viewed

@@ -1,5 +1,5 @@
 import streamlit as st
-from transformers import pipeline
 import torch
 import os
 import sys
@@ -18,7 +18,7 @@ if not hf_token:
 def load_pipeline(model_name):
     with st.spinner(f'Loading {model_name}... This may take several minutes.'):
         try:
-            pipe = pipeline("text-generation", model=model_name,device=-1)
         except Exception as e:
             st.error(f"An error occurred: {e}")
             st.stop()

 import streamlit as st
+from optimum.nvidia.pipelines import pipeline
 import torch
 import os
 import sys
 def load_pipeline(model_name):
     with st.spinner(f'Loading {model_name}... This may take several minutes.'):
         try:
+            pipe = pipeline("text-generation", model=model_name,use_fp8=True)
         except Exception as e:
             st.error(f"An error occurred: {e}")
             st.stop()

requirements.txt CHANGED Viewed

@@ -1,5 +1,4 @@
 streamlit
-transformers
 torch
-bitsandbytes==0.39.1
-accelerate

 streamlit
 torch
+--extra-index-url https://pypi.nvidia.com
+optimum-nvidia