Spaces:

ginigen
/

Sign-language

Building

App Files Files Community

openfree commited on Jan 26

Commit

d1c3219

verified ·

1 Parent(s): e4aee44

Update src/main.py

Browse files

Files changed (1) hide show

src/main.py +4 -9

src/main.py CHANGED Viewed

@@ -2,7 +2,7 @@ import display_gloss as dg
 import synonyms_preprocess as sp
 from NLP_Spacy_base_translator import NlpSpacyBaseTranslator
 from flask import Flask, render_template, Response, request
-from transformers import pipeline, AutoTokenizer, AutoModelForSeq2SeqTranslation
 import torch
 import os
@@ -22,8 +22,8 @@ os.environ['CUDA_VISIBLE_DEVICES'] = ''
 # Load pre-trained Korean-English translation model
 model_name = "Helsinki-NLP/opus-mt-ko-en"
-tokenizer = AutoTokenizer.from_pretrained(model_name, cache_dir=cache_dir)
-model = AutoModelForSeq2SeqTranslation.from_pretrained(model_name, cache_dir=cache_dir)
 model = model.to(device)
 nlp, dict_docs_spacy = sp.load_spacy_values()
@@ -31,12 +31,11 @@ dataset, list_2000_tokens = dg.load_data()
 def translate_korean_to_english(text):
    try:
-       # Check if input is Korean
        if any('\u3131' <= char <= '\u318F' or '\uAC00' <= char <= '\uD7A3' for char in text):
            inputs = tokenizer(text, return_tensors="pt", padding=True)
            outputs = model.generate(**inputs)
            translation = tokenizer.decode(outputs[0], skip_special_tokens=True)
-           print(f"Translated text: {translation}")  # Debug log
            return translation
        return text
    except Exception as e:
@@ -52,18 +51,14 @@ def result():
    if request.method == 'POST':
        input_text = request.form['inputSentence']
        try:
-           # Translate to English
            english_text = translate_korean_to_english(input_text)
-           # Check if translation failed
            if english_text == input_text and any('\u3131' <= char <= '\u318F' or '\uAC00' <= char <= '\uD7A3' for char in input_text):
                raise Exception("Translation failed")
-           # Convert to ASL gloss
            eng_to_asl_translator = NlpSpacyBaseTranslator(sentence=english_text)
            generated_gloss = eng_to_asl_translator.translate_to_gloss()
-           # Process gloss
            gloss_list_lower = [gloss.lower() for gloss in generated_gloss.split() if gloss.isalnum()]
            gloss_sentence_before_synonym = " ".join(gloss_list_lower)

 import synonyms_preprocess as sp
 from NLP_Spacy_base_translator import NlpSpacyBaseTranslator
 from flask import Flask, render_template, Response, request
+from transformers import MarianMTModel, MarianTokenizer
 import torch
 import os
 # Load pre-trained Korean-English translation model
 model_name = "Helsinki-NLP/opus-mt-ko-en"
+tokenizer = MarianTokenizer.from_pretrained(model_name, cache_dir=cache_dir)
+model = MarianMTModel.from_pretrained(model_name, cache_dir=cache_dir)
 model = model.to(device)
 nlp, dict_docs_spacy = sp.load_spacy_values()
 def translate_korean_to_english(text):
    try:
        if any('\u3131' <= char <= '\u318F' or '\uAC00' <= char <= '\uD7A3' for char in text):
            inputs = tokenizer(text, return_tensors="pt", padding=True)
            outputs = model.generate(**inputs)
            translation = tokenizer.decode(outputs[0], skip_special_tokens=True)
+           print(f"Translated text: {translation}")
            return translation
        return text
    except Exception as e:
    if request.method == 'POST':
        input_text = request.form['inputSentence']
        try:
            english_text = translate_korean_to_english(input_text)
            if english_text == input_text and any('\u3131' <= char <= '\u318F' or '\uAC00' <= char <= '\uD7A3' for char in input_text):
                raise Exception("Translation failed")
            eng_to_asl_translator = NlpSpacyBaseTranslator(sentence=english_text)
            generated_gloss = eng_to_asl_translator.translate_to_gloss()
            gloss_list_lower = [gloss.lower() for gloss in generated_gloss.split() if gloss.isalnum()]
            gloss_sentence_before_synonym = " ".join(gloss_list_lower)