Spaces:

westronai
/

comparador-de-traducoes

Sleeping

App Files Files Community

westronai commited on Sep 29

Commit

1e79dbd

•

1 Parent(s): 0c8427c

Upload 4 files

Browse files

Files changed (4) hide show

app.py +16 -0
model.py +15 -0
requirements.txt +3 -0
translator.py +38 -0

app.py ADDED Viewed

	@@ -0,0 +1,16 @@

+import gradio as gr
+from translator import traduzir_comparar
+demo = gr.Interface(
+    fn=traduzir_comparar,
+    inputs=gr.Textbox(label="Texto em Inglês", placeholder="Digite a frase em inglês aqui..."),
+    outputs=gr.Textbox(label="Tradução"),
+    title="Comparação de Traduções",
+    description="""Insira uma frase em inglês para visualizar a tradução gerada pelo modelo original e pelo modelo após passar por fine-tuning com textos de documentações técnicas:\n
+                  Modelo original: Helsinki-NLP/opus-mt-tc-big-en-pt\n
+                  Modelo fine-tuned: westronai/translation-en-pt""",
+    theme=gr.themes.Monochrome()
+)
+if __name__ == "__main__":
+    demo.launch()

model.py ADDED Viewed

	@@ -0,0 +1,15 @@

+from transformers import MarianMTModel, MarianTokenizer
+def carrega_modelo(nome_modelo: str) -> tuple:
+    """
+    Carrega um modelo de tradução pré-treinado e seu tokenizer.
+    Args:
+        nome_modelo (str): Nome do modelo pré-treinado a ser carregado.
+    Returns:
+        tuple: Uma tupla contendo o tokenizer e o modelo de tradução.
+    """
+    tokenizer = MarianTokenizer.from_pretrained(nome_modelo)
+    model = MarianMTModel.from_pretrained(nome_modelo)
+    return (tokenizer, model)

requirements.txt ADDED Viewed

	@@ -0,0 +1,3 @@

+gradio==4.44.0
+transformers==4.44.2
+sentencepiece==0.2.0

translator.py ADDED Viewed

	@@ -0,0 +1,38 @@

+from model import carrega_modelo
+tokenizador_original, modelo_original = carrega_modelo('Helsinki-NLP/opus-mt-tc-big-en-pt')
+tokenizador_finetuned, modelo_finetuned = carrega_modelo('westronai/translation-en-pt')
+def traduz_sentenca(model, tokenizer, texto_ingles: str):
+    """
+    Traduz uma sentença do inglês para o português usando um modelo de tradução.
+    Args:
+        model: O modelo de tradução pré-treinado.
+        tokenizer: O tokenizer responsável por preparar o texto.
+        texto_ingles (str): A sentença em inglês que será traduzida.
+    Returns:
+        dict: Dicionário com a sentença original e sua tradução.
+    """
+    tokens = tokenizer(texto_ingles, return_tensors="pt", padding=True)
+    translated = model.generate(**tokens)
+    texto_portugues = tokenizer.decode(translated[0], skip_special_tokens=True)
+    return {
+        'texto_ingles': texto_ingles,
+        'texto_portugues': texto_portugues
+    }
+def traduzir_comparar(texto_ingles):
+    """
+    Compara as traduções geradas pelo modelo original e pelo modelo fine-tuned.
+    Args:
+        texto_ingles (str): O texto em inglês a ser traduzido.
+    Returns:
+        str: String formatada contendo as traduções de ambos os modelos.
+    """
+    traducao_original = traduz_sentenca(modelo_original, tokenizador_original, texto_ingles)
+    traducao_finetuned = traduz_sentenca(modelo_finetuned, tokenizador_finetuned, texto_ingles)
+    return f"Modelo Original: {traducao_original['texto_portugues']}\n\nModelo Fine-Tuned: {traducao_finetuned['texto_portugues']}"