Spaces:

MaxP
/

demo-document-qa

Sleeping

MaxP commited on Jun 13, 2023

Commit

17a838d

1 Parent(s): 7a3063b

init

Files changed (1) hide show

app.py CHANGED Viewed

@@ -9,7 +9,7 @@ from torchvision import transforms
 import torch
 from PIL import Image
-device = 'cuda' if torch.cuda.is_available() else 'cpu'
 model_name = 'naver-clova-ix/donut-base-finetuned-docvqa'
 # Importante esta app esta pensada para que el modelo corra en CPU
@@ -27,8 +27,8 @@ def process_image(image, question):
     decoder_input_ids = processor.tokenizer(prompt, add_special_tokens=False, return_tensors='pt').input_ids
     # Defino los outputs
     outputs = model.generate(
-        pixel_values.to(device).half(),
-        decoder_input_ids=decoder_input_ids.to(device),
         max_length=model.decoder.config.max_position_embeddings,
         early_stopping=True,
         pad_token_id=processor.tokenizer.pad_token_id,
@@ -60,4 +60,6 @@ demo = gr.Interface(
         ['examples/extracto.jpg', 'cual es el telefono de centros servicios de banco galicia?'],
         ['examples/factura_5.jpg', 'cual es el total de la factura?'],
     ]
-)

 import torch
 from PIL import Image
+# device = 'cuda' if torch.cuda.is_available() else 'cpu'
 model_name = 'naver-clova-ix/donut-base-finetuned-docvqa'
 # Importante esta app esta pensada para que el modelo corra en CPU
     decoder_input_ids = processor.tokenizer(prompt, add_special_tokens=False, return_tensors='pt').input_ids
     # Defino los outputs
     outputs = model.generate(
+        pixel_values,
+        decoder_input_ids=decoder_input_ids,
         max_length=model.decoder.config.max_position_embeddings,
         early_stopping=True,
         pad_token_id=processor.tokenizer.pad_token_id,
         ['examples/extracto.jpg', 'cual es el telefono de centros servicios de banco galicia?'],
         ['examples/factura_5.jpg', 'cual es el total de la factura?'],
     ]
+)
+demo.launch(inline=True)