Spaces:
Sleeping
Sleeping
title: "Transcripción de Audio Multilingüe" | |
emoji: "🗣️" | |
colorFrom: "blue" | |
colorTo: "purple" | |
sdk: gradio | |
sdk_version: "4.44.1" | |
app_file: app.py | |
pinned: false | |
# Aplicación de Transcripción de Audio Multilingüe | |
Esta aplicación permite transcribir archivos de audio en inglés y español a texto utilizando el modelo Whisper de OpenAI a través de Hugging Face y una interfaz web amigable creada con Gradio. | |
## Características | |
- Soporta múltiples formatos de audio (e.g., MP3, WAV). | |
- Detecta y transcribe automáticamente los idiomas inglés y español. | |
- Interfaz web sencilla para subir archivos y ver transcripciones. | |
- Incluye archivos de ejemplo para probar la funcionalidad. | |
## Cómo Usar | |
1. **Subir un Archivo de Audio:** | |
- Haz clic en el botón de carga y selecciona un archivo de audio en inglés o español (e.g., MP3, WAV). | |
2. **Esperar la Transcripción:** | |
- El modelo procesará el audio y mostrará el texto transcrito en la sección de salida. | |
3. **Ver y Copiar el Texto:** | |
- Una vez finalizada la transcripción, podrás ver el texto y copiarlo según sea necesario. | |
## Tecnologías Utilizadas | |
- [Gradio](https://gradio.app/) para la interfaz web. | |
- [Hugging Face Transformers](https://huggingface.co/docs/transformers/index) para el modelo de transcripción. | |
- [Librosa](https://librosa.org/) para el procesamiento de audio. | |
## Despliegue | |
Esta aplicación está desplegada en [Hugging Face Spaces](https://huggingface.co/spaces). | |
## Licencia | |
[MIT](LICENSE) | |