|
# Dataset: vmunozf/dataset |
|
|
|
Este dataset está diseñado para entrenar y probar modelos de lenguaje con enfoque en preguntas y respuestas en español. La información contenida está estructurada para facilitar su uso en tareas de procesamiento de lenguaje natural (NLP). |
|
|
|
## Estructura del Dataset |
|
|
|
El archivo contiene dos columnas principales: |
|
- **Pregunta**: Incluye preguntas formuladas en español relacionadas con temas de interés. |
|
- **Respuesta**: Proporciona la respuesta correspondiente a cada pregunta. |
|
|
|
Ejemplo de datos: |
|
| Pregunta | Respuesta | |
|
|-----------------------------------------------------------------|----------------------------------------| |
|
| ¿Qué porcentaje de los recursos hídricos renovables del mundo se encuentra en América Latina y el Caribe? | 35%. | |
|
| ¿Cuál es la principal causa de la crisis hídrica en América Latina según los estudios mencionados? | La mala gestión de los recursos hídricos. | |
|
|
|
## Uso |
|
|
|
Este dataset puede ser utilizado para: |
|
1. Entrenamiento y fine-tuning de modelos de lenguaje (por ejemplo, LLaMA, GPT, BERT). |
|
2. Pruebas de inferencia en sistemas de preguntas y respuestas. |
|
3. Evaluación de modelos en tareas de comprensión y generación de texto en español. |
|
|
|
## Licencia |
|
|
|
Este dataset se distribuye bajo la licencia Apache 2.0. Puedes utilizarlo libremente, siempre y cuando respetes los términos de la licencia. |
|
|
|
## Contacto |
|
|
|
Para consultas o contribuciones, por favor contacta a [tu email o enlace relevante]. |
|
|