Spaces:

AliEssa555
/

FYP

Runtime error

App Files Files Community

AliEssa555 commited on Nov 14, 2024

Commit

96cf708

verified ·

1 Parent(s): 4610028

Create app.py

Browse files

Files changed (1) hide show

app.py +46 -0

app.py ADDED Viewed

	@@ -0,0 +1,46 @@

+import gradio as gr
+import torch
+from transformers import AutoModelForCausalLM, AutoTokenizer
+# Load your model and tokenizer
+from peft import PeftModel, PeftConfig
+from transformers import AutoModelForCausalLM
+config = PeftConfig.from_pretrained("AliEssa555/podcast_model_ft")
+base_model = AutoModelForCausalLM.from_pretrained("TheBloke/Mistral-7B-Instruct-v0.2-GPTQ")
+model_name = PeftModel.from_pretrained(base_model, "AliEssa555/podcast_model_ft")
+#model_name = "path_to_your_fine_tuned_model"  # Use the local path or the Hugging Face model hub ID if published
+model = AutoModelForCausalLM.from_pretrained(model_name, torch_dtype=torch.float16)
+tokenizer = AutoTokenizer.from_pretrained(model_name)
+if torch.cuda.is_available():
+    model = model.to("cuda")
+# Generate a response based on user input
+def generate_response(user_input):
+    # Format the input as an instructional prompt
+    prompt = f"[INST] User: {user_input} [/INST] Assistant:"
+    # Tokenize input and generate response
+    inputs = tokenizer(prompt, return_tensors="pt").to("cuda" if torch.cuda.is_available() else "cpu")
+    output_tokens = model.generate(inputs["input_ids"], max_length=512, temperature=0.7, top_p=0.9, do_sample=True)
+    # Decode and format the output
+    response = tokenizer.decode(output_tokens[0], skip_special_tokens=True)
+    return response.split("Assistant:")[-1].strip()  # Remove "Assistant:" tag if present
+# Define Gradio interface
+with gr.Blocks() as demo:
+    gr.Markdown("## LLM Podcast Response Generator")
+    with gr.Row():
+        user_input = gr.Textbox(label="Enter your question related to the podcast:", placeholder="Type your question here...")
+    with gr.Row():
+        response_output = gr.Textbox(label="Model's Response")
+    submit_button = gr.Button("Generate Response")
+    # Connect button to the function
+    submit_button.click(fn=generate_response, inputs=user_input, outputs=response_output)
+# Launch the Gradio app
+demo.launch()