Spaces:
Sleeping
Sleeping
dataset model json en
Browse files
app.py
CHANGED
@@ -535,19 +535,21 @@ class ModeloDataset:
|
|
535 |
filtered_labels = []
|
536 |
|
537 |
|
538 |
-
|
539 |
-
|
540 |
-
|
541 |
-
|
542 |
-
|
543 |
-
|
544 |
-
|
545 |
-
|
546 |
-
|
547 |
-
|
548 |
-
|
549 |
-
|
550 |
-
|
|
|
|
|
551 |
|
552 |
###
|
553 |
### Procesa los tokens generados del texto de entradas con los tokens predichos, para generar los tokens por palabra
|
|
|
535 |
filtered_labels = []
|
536 |
|
537 |
|
538 |
+
tok_new=[]
|
539 |
+
lab_new=[]
|
540 |
+
#se descartan los tokens speciales
|
541 |
+
for token_linea, label_linea in zip(new_tokens, new_identificadores):
|
542 |
+
filtered_tokens = []
|
543 |
+
filtered_labels = []
|
544 |
+
for token, label in zip(token_linea, label_linea):
|
545 |
+
if token not in special_tokens:
|
546 |
+
|
547 |
+
filtered_tokens.append(token)
|
548 |
+
filtered_labels.append(label)
|
549 |
+
tok_new.append(filtered_tokens)
|
550 |
+
lab_new.append(filtered_labels)
|
551 |
+
|
552 |
+
return tok_new,lab_new #new_identificadores, new_tokens
|
553 |
|
554 |
###
|
555 |
### Procesa los tokens generados del texto de entradas con los tokens predichos, para generar los tokens por palabra
|