llama / README.md
vmunozf's picture
Update README.md
dff68c7 verified
|
raw
history blame
1.6 kB

Dataset: vmunozf/dataset

Este dataset está diseñado para entrenar y probar modelos de lenguaje con enfoque en preguntas y respuestas en español. La información contenida está estructurada para facilitar su uso en tareas de procesamiento de lenguaje natural (NLP).

Estructura del Dataset

El archivo contiene dos columnas principales:

  • Pregunta: Incluye preguntas formuladas en español relacionadas con temas de interés.
  • Respuesta: Proporciona la respuesta correspondiente a cada pregunta.

Ejemplo de datos:

Pregunta Respuesta
¿Qué porcentaje de los recursos hídricos renovables del mundo se encuentra en América Latina y el Caribe? 35%.
¿Cuál es la principal causa de la crisis hídrica en América Latina según los estudios mencionados? La mala gestión de los recursos hídricos.

Uso

Este dataset puede ser utilizado para:

  1. Entrenamiento y fine-tuning de modelos de lenguaje (por ejemplo, LLaMA, GPT, BERT).
  2. Pruebas de inferencia en sistemas de preguntas y respuestas.
  3. Evaluación de modelos en tareas de comprensión y generación de texto en español.

Licencia

Este dataset se distribuye bajo la licencia Apache 2.0. Puedes utilizarlo libremente, siempre y cuando respetes los términos de la licencia.

Contacto

Para consultas o contribuciones, por favor contacta a [tu email o enlace relevante].