Merlintxu's picture
modificación README.md según HF
2466210
|
raw
history blame
1.52 kB
---
title: "Transcripción de Audio Multilingüe"
emoji: "🗣️"
colorFrom: "blue"
colorTo: "purple"
sdk: gradio
sdk_version: "4.44.1"
app_file: app.py
pinned: false
---
# Aplicación de Transcripción de Audio Multilingüe
Esta aplicación permite transcribir archivos de audio en inglés y español a texto utilizando el modelo Whisper de OpenAI a través de Hugging Face y una interfaz web amigable creada con Gradio.
## Características
- Soporta múltiples formatos de audio (e.g., MP3, WAV).
- Detecta y transcribe automáticamente los idiomas inglés y español.
- Interfaz web sencilla para subir archivos y ver transcripciones.
- Incluye archivos de ejemplo para probar la funcionalidad.
## Cómo Usar
1. **Subir un Archivo de Audio:**
- Haz clic en el botón de carga y selecciona un archivo de audio en inglés o español (e.g., MP3, WAV).
2. **Esperar la Transcripción:**
- El modelo procesará el audio y mostrará el texto transcrito en la sección de salida.
3. **Ver y Copiar el Texto:**
- Una vez finalizada la transcripción, podrás ver el texto y copiarlo según sea necesario.
## Tecnologías Utilizadas
- [Gradio](https://gradio.app/) para la interfaz web.
- [Hugging Face Transformers](https://huggingface.co/docs/transformers/index) para el modelo de transcripción.
- [Librosa](https://librosa.org/) para el procesamiento de audio.
## Despliegue
Esta aplicación está desplegada en [Hugging Face Spaces](https://huggingface.co/spaces).
## Licencia
[MIT](LICENSE)