Update README.md
Browse files
README.md
CHANGED
@@ -1,11 +1,30 @@
|
|
1 |
-
|
2 |
-
|
3 |
-
|
4 |
-
|
5 |
-
|
6 |
-
|
7 |
-
|
8 |
-
-
|
9 |
-
|
10 |
-
|
11 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
# Dataset: vmunozf/dataset
|
2 |
+
|
3 |
+
Este dataset está diseñado para entrenar y probar modelos de lenguaje con enfoque en preguntas y respuestas en español. La información contenida está estructurada para facilitar su uso en tareas de procesamiento de lenguaje natural (NLP).
|
4 |
+
|
5 |
+
## Estructura del Dataset
|
6 |
+
|
7 |
+
El archivo contiene dos columnas principales:
|
8 |
+
- **Pregunta**: Incluye preguntas formuladas en español relacionadas con temas de interés.
|
9 |
+
- **Respuesta**: Proporciona la respuesta correspondiente a cada pregunta.
|
10 |
+
|
11 |
+
Ejemplo de datos:
|
12 |
+
| Pregunta | Respuesta |
|
13 |
+
|-----------------------------------------------------------------|----------------------------------------|
|
14 |
+
| ¿Qué porcentaje de los recursos hídricos renovables del mundo se encuentra en América Latina y el Caribe? | 35%. |
|
15 |
+
| ¿Cuál es la principal causa de la crisis hídrica en América Latina según los estudios mencionados? | La mala gestión de los recursos hídricos. |
|
16 |
+
|
17 |
+
## Uso
|
18 |
+
|
19 |
+
Este dataset puede ser utilizado para:
|
20 |
+
1. Entrenamiento y fine-tuning de modelos de lenguaje (por ejemplo, LLaMA, GPT, BERT).
|
21 |
+
2. Pruebas de inferencia en sistemas de preguntas y respuestas.
|
22 |
+
3. Evaluación de modelos en tareas de comprensión y generación de texto en español.
|
23 |
+
|
24 |
+
## Licencia
|
25 |
+
|
26 |
+
Este dataset se distribuye bajo la licencia Apache 2.0. Puedes utilizarlo libremente, siempre y cuando respetes los términos de la licencia.
|
27 |
+
|
28 |
+
## Contacto
|
29 |
+
|
30 |
+
Para consultas o contribuciones, por favor contacta a [tu email o enlace relevante].
|