Spaces:
Sleeping
Sleeping
æLtorio
commited on
add warning message while using without gpu
Browse files
app.py
CHANGED
@@ -26,7 +26,7 @@ if torch.cuda.is_available():
|
|
26 |
# Initialize the processor from the base model path
|
27 |
processor = AutoProcessor.from_pretrained(base_model_path, trust_remote_code=True)
|
28 |
# Initialize the model from the base model path and set the torch dtype to bfloat16
|
29 |
-
peft_model = AutoPeftModelForCausalLM.from_pretrained(hugging_face_model_id)
|
30 |
merged_model = peft_model.merge_and_unload()
|
31 |
tokenizer = AutoTokenizer.from_pretrained(hugging_face_model_id)
|
32 |
|
@@ -50,10 +50,18 @@ if torch.cuda.is_available():
|
|
50 |
user_question= f"Veuillez rédiger une appréciation en moins de 40 mots pour le {trimestre_full} pour cet élève qui a eu {moyenne_3} de moyenne ce trimestre, {moyenne_2} au deuxième trimestre et {moyenne_1} au premier trimestre, j'ai évalué son comportement à {comportement}/10, sa participation à {participation}/10 et son travail à {travail}/10. Les notes ne doivent pas apparaître dans l'appréciation."
|
51 |
|
52 |
# Define a chat template for the model to respond to
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
53 |
messages = [
|
54 |
{
|
55 |
"role": "system",
|
56 |
-
"content": "Vous êtes une IA assistant les enseignants d'histoire-géographie en rédigeant à leur place une appréciation personnalisée pour leur élève en fonction de ses performances. Votre appreciation doit être en français,
|
57 |
{
|
58 |
"role": "user",
|
59 |
"content": user_question},
|
@@ -63,8 +71,12 @@ if torch.cuda.is_available():
|
|
63 |
tokenize = True,
|
64 |
add_generation_prompt = True, # Must add for generation
|
65 |
return_tensors = "pt",).to(device)
|
66 |
-
outputs = merged_model.generate(input_ids = inputs,
|
67 |
-
|
|
|
|
|
|
|
|
|
68 |
decoded_sequences = tokenizer.batch_decode(outputs[:, inputs.shape[1]:],skip_special_tokens=True)[0]
|
69 |
return decoded_sequences
|
70 |
|
@@ -89,7 +101,8 @@ else:
|
|
89 |
print("No GPU available")
|
90 |
device = torch.device('cpu')
|
91 |
def infere(trimestre: str, moyenne_1: float,moyenne_2: float,moyenne_3: float, comportement: float, participation: float, travail: float) -> str:
|
92 |
-
|
|
|
93 |
|
94 |
# Create a Gradio interface with the infere function and specified title and descriptions
|
95 |
autoeval = gr.Interface(fn=infere, inputs=[
|
|
|
26 |
# Initialize the processor from the base model path
|
27 |
processor = AutoProcessor.from_pretrained(base_model_path, trust_remote_code=True)
|
28 |
# Initialize the model from the base model path and set the torch dtype to bfloat16
|
29 |
+
peft_model = AutoPeftModelForCausalLM.from_pretrained(hugging_face_model_id,low_cpu_mem_usage=True)
|
30 |
merged_model = peft_model.merge_and_unload()
|
31 |
tokenizer = AutoTokenizer.from_pretrained(hugging_face_model_id)
|
32 |
|
|
|
50 |
user_question= f"Veuillez rédiger une appréciation en moins de 40 mots pour le {trimestre_full} pour cet élève qui a eu {moyenne_3} de moyenne ce trimestre, {moyenne_2} au deuxième trimestre et {moyenne_1} au premier trimestre, j'ai évalué son comportement à {comportement}/10, sa participation à {participation}/10 et son travail à {travail}/10. Les notes ne doivent pas apparaître dans l'appréciation."
|
51 |
|
52 |
# Define a chat template for the model to respond to
|
53 |
+
_messages = [
|
54 |
+
{
|
55 |
+
"role": "system",
|
56 |
+
"content": "Vous êtes une IA assistant les enseignants d'histoire-géographie en rédigeant à leur place une appréciation personnalisée pour leur élève en fonction de ses performances. Votre appreciation doit être en français, bienveillante, constructive, et aider l'élève à comprendre ses points forts et les axes d'amélioration. Votre appréciation doit comporter de 1 à 40 mots. Votre appréciation ne doit jamais comporter la valeur de la note. Votre appréciation doit utiliser le style impersonnel. Attention l'élément le plus important de votre analyse doit rester la moyenne du trimestre"},
|
57 |
+
{
|
58 |
+
"role": "user",
|
59 |
+
"content": user_question},
|
60 |
+
]
|
61 |
messages = [
|
62 |
{
|
63 |
"role": "system",
|
64 |
+
"content": "Vous êtes une IA assistant les enseignants d'histoire-géographie en rédigeant à leur place une appréciation personnalisée pour leur élève en fonction de ses performances. Votre appreciation doit être en français, et doit aider l'élève à comprendre ses points forts et les axes d'amélioration. Votre appréciation doit comporter de 1 à 40 mots. Votre appréciation ne doit jamais comporter la valeur de la note. Votre appréciation doit utiliser le style impersonnel.Attention l'élément le plus important de votre analyse doit rester la moyenne du trimestre"},
|
65 |
{
|
66 |
"role": "user",
|
67 |
"content": user_question},
|
|
|
71 |
tokenize = True,
|
72 |
add_generation_prompt = True, # Must add for generation
|
73 |
return_tensors = "pt",).to(device)
|
74 |
+
outputs = merged_model.generate(input_ids = inputs,
|
75 |
+
max_new_tokens = 90,
|
76 |
+
use_cache = True,
|
77 |
+
temperature = 1.5,
|
78 |
+
min_p = 0.1,
|
79 |
+
pad_token_id=tokenizer.eos_token_id,)
|
80 |
decoded_sequences = tokenizer.batch_decode(outputs[:, inputs.shape[1]:],skip_special_tokens=True)[0]
|
81 |
return decoded_sequences
|
82 |
|
|
|
101 |
print("No GPU available")
|
102 |
device = torch.device('cpu')
|
103 |
def infere(trimestre: str, moyenne_1: float,moyenne_2: float,moyenne_3: float, comportement: float, participation: float, travail: float) -> str:
|
104 |
+
gr.Warning("No GPU available <br>Open a message in the <a href='https://huggingface.co/spaces/eltorio/Llama-3.2-3B-appreciation/discussions'>Community Discussion</a>")
|
105 |
+
return "No GPU available, please contact me on the community discussion"
|
106 |
|
107 |
# Create a Gradio interface with the infere function and specified title and descriptions
|
108 |
autoeval = gr.Interface(fn=infere, inputs=[
|