Spaces:

bambadij
/

summaryT5

Running

bambadij commited on Aug 27, 2024

Commit

505ff54

verified ·

1 Parent(s): 3dbe404

update

Files changed (1) hide show

app.py CHANGED Viewed

@@ -20,6 +20,7 @@ os.environ['HF_HOME'] = '/app/.cache'
 # model = T5ForConditionalGeneration.from_pretrained(model_name)
 # model = AutoModelForCausalLM.from_pretrained("THUDM/longwriter-glm4-9b", trust_remote_code=True)
 # tokenizer = AutoTokenizer.from_pretrained("THUDM/longwriter-glm4-9b", trust_remote_code=True)
 # Configuration du client OpenAI avec l'API NVIDIA
 client = OpenAI(
@@ -98,8 +99,8 @@ async def generate_text(request: RequestModel):
         model="meta/llama-3.1-8b-instruct",
         messages=[{"role": "user", "content": instructions_par_defaut + request.text}],
         temperature=0.2,
-        top_p=0.7,
-        max_tokens=1024,
         stream=True
     )
     # response = ollama.chat(

 # model = T5ForConditionalGeneration.from_pretrained(model_name)
 # model = AutoModelForCausalLM.from_pretrained("THUDM/longwriter-glm4-9b", trust_remote_code=True)
 # tokenizer = AutoTokenizer.from_pretrained("THUDM/longwriter-glm4-9b", trust_remote_code=True)
+prompt_first ="Résumé en 4 ou 5 phrases de la plainte suivante :"
 # Configuration du client OpenAI avec l'API NVIDIA
 client = OpenAI(
         model="meta/llama-3.1-8b-instruct",
         messages=[{"role": "user", "content": instructions_par_defaut + request.text}],
         temperature=0.2,
+        top_p=0.9,
+        # max_tokens=1024,
         stream=True
     )
     # response = ollama.chat(