dayannex commited on
Commit
df6d792
·
1 Parent(s): 0b1fcbf

dataset model json en

Browse files
Files changed (1) hide show
  1. app.py +15 -13
app.py CHANGED
@@ -535,19 +535,21 @@ class ModeloDataset:
535
  filtered_labels = []
536
 
537
 
538
- tok_new=[]
539
- lab_new=[]
540
- #se descartan los tokens speciales
541
- for token_linea, label_linea in zip(new_tokens, new_identificadores):
542
- for token, label in zip(token_linea, label_linea):
543
- if token not in special_tokens:
544
- print('token:*********************************', token)
545
- filtered_tokens.append(token)
546
- filtered_labels.append(label)
547
- tok_new.append(filtered_tokens)
548
- lab_new.append(filtered_labels)
549
-
550
- return tok_new,lab_new #new_identificadores, new_tokens
 
 
551
 
552
  ###
553
  ### Procesa los tokens generados del texto de entradas con los tokens predichos, para generar los tokens por palabra
 
535
  filtered_labels = []
536
 
537
 
538
+ tok_new=[]
539
+ lab_new=[]
540
+ #se descartan los tokens speciales
541
+ for token_linea, label_linea in zip(new_tokens, new_identificadores):
542
+ filtered_tokens = []
543
+ filtered_labels = []
544
+ for token, label in zip(token_linea, label_linea):
545
+ if token not in special_tokens:
546
+
547
+ filtered_tokens.append(token)
548
+ filtered_labels.append(label)
549
+ tok_new.append(filtered_tokens)
550
+ lab_new.append(filtered_labels)
551
+
552
+ return tok_new,lab_new #new_identificadores, new_tokens
553
 
554
  ###
555
  ### Procesa los tokens generados del texto de entradas con los tokens predichos, para generar los tokens por palabra