LeireTedCas commited on
Commit
a61330b
·
1 Parent(s): 1242c24

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +6 -6
app.py CHANGED
@@ -39,12 +39,12 @@ def remove_non_printable(value):
39
  value = re.sub(r'\t(?=[.,;:!?¿)\d])|\t(?<=[.,;:!?¿)\d])', ' ', value)
40
  # Eliminar \xa0 antes o después de ciertos caracteres
41
  value = re.sub(r'\xa0(?=[.,;:!?¿)\d])|\xa0(?<=[.,;:!?¿)\d])', ' ', value)
42
- # Eliminar \n específico después de un punto y antes de una palabra
43
- value = re.sub(r'\.\n(?=\w)', '. ', value)
44
- # Eliminar \t específico después de un punto y antes de una palabra
45
- value = re.sub(r'\.\t(?=\w)', '. ', value)
46
- # Eliminar \xa0 específico después de un punto y antes de una palabra
47
- value = re.sub(r'\.\xa0(?=\w)', '. ', value)
48
  return value
49
  #return re.sub(r'[\n[\n\t\xa0]*\t[\n\t\xa0]*\xa0[\n\t\xa0]*]',' ',value)
50
  #return re.sub(r'[^\x20-\x7E\n\t\xa0]|(?<=\w)\n|(?<=\w)\t', '', value)
 
39
  value = re.sub(r'\t(?=[.,;:!?¿)\d])|\t(?<=[.,;:!?¿)\d])', ' ', value)
40
  # Eliminar \xa0 antes o después de ciertos caracteres
41
  value = re.sub(r'\xa0(?=[.,;:!?¿)\d])|\xa0(?<=[.,;:!?¿)\d])', ' ', value)
42
+ # Eliminar \n específico después de un punto y antes \
43
+ value = re.sub(r'\.\n(?=\\)', '. ', value)
44
+ # Eliminar \t específico después de un punto y antes \
45
+ value = re.sub(r'\.\t(?=\\)', '. ', value)
46
+ # Eliminar \xa0 específico después de un punto y antes \
47
+ value = re.sub(r'\.\xa0(?=\\)', '. ', value)
48
  return value
49
  #return re.sub(r'[\n[\n\t\xa0]*\t[\n\t\xa0]*\xa0[\n\t\xa0]*]',' ',value)
50
  #return re.sub(r'[^\x20-\x7E\n\t\xa0]|(?<=\w)\n|(?<=\w)\t', '', value)