Spaces:

Merlintxu
/

audio-transcription-app

Sleeping

audio-transcription-app / README.md

modificación README.md según HF

2466210 22 days ago

1.52 kB

	---
	title: "Transcripción de Audio Multilingüe"
	emoji: "🗣️"
	colorFrom: "blue"
	colorTo: "purple"
	sdk: gradio
	sdk_version: "4.44.1"
	app_file: app.py
	pinned: false
	---

	# Aplicación de Transcripción de Audio Multilingüe

	Esta aplicación permite transcribir archivos de audio en inglés y español a texto utilizando el modelo Whisper de OpenAI a través de Hugging Face y una interfaz web amigable creada con Gradio.

	## Características

	- Soporta múltiples formatos de audio (e.g., MP3, WAV).
	- Detecta y transcribe automáticamente los idiomas inglés y español.
	- Interfaz web sencilla para subir archivos y ver transcripciones.
	- Incluye archivos de ejemplo para probar la funcionalidad.

	## Cómo Usar

	1. Subir un Archivo de Audio:
	- Haz clic en el botón de carga y selecciona un archivo de audio en inglés o español (e.g., MP3, WAV).

	2. Esperar la Transcripción:
	- El modelo procesará el audio y mostrará el texto transcrito en la sección de salida.

	3. Ver y Copiar el Texto:
	- Una vez finalizada la transcripción, podrás ver el texto y copiarlo según sea necesario.

	## Tecnologías Utilizadas

	- [Gradio](https://gradio.app/) para la interfaz web.
	- [Hugging Face Transformers](https://huggingface.co/docs/transformers/index) para el modelo de transcripción.
	- [Librosa](https://librosa.org/) para el procesamiento de audio.

	## Despliegue

	Esta aplicación está desplegada en [Hugging Face Spaces](https://huggingface.co/spaces).

	## Licencia

	[MIT](LICENSE)