CÓMO FUNCIONA Y EN QUÉ CONSISTE

#1
by RAMONMINANA - opened

RESULTA RIDICULO, LO SÉ.
PERO ¿ALGUIEN ME PUEDE DECIR CÓMO FUNCIONA Y EN QUÉ CONSISTE ESTO?
GRACIAS

LittleJohn org

¡Por supuesto! Los modelos de embeddings como el nuestro son herramientas muy útiles en el procesamiento del lenguaje natural.

Verás, funciona así:

  1. Este modelo convierte texto (frases o párrafos) en vectores numéricos de 1024 dimensiones. Estos vectores capturan el significado semántico del texto.
  2. Procesa este texto a través de una red neuronal entrenada.
  3. Genera un vector de 1024 números que representa el significado del texto en números

¿Y qué usos se le puede dar?

  • Comparar textos: Textos con significados similares tendrán vectores parecidos.
  • Búsqueda semántica: Encontrar textos relacionados conceptualmente.
  • Clasificación de textos: Agrupar documentos por temas.
  • Detección de paráfrasis: Identificar textos que dicen lo mismo de forma diferente.

.. (Por si quieres ampliar, detalles más avanzados)

  • Está basado en el modelo BAAI/bge-m3, pero finetuneado para texto legal en español.
  • Puede procesar hasta 8192 tokens (palabras o partes de palabras) a la vez.
  • Utiliza la similitud del coseno para comparar vectores.

Sé que me he alargado mucho pero... en resumen, es una herramienta poderosa para analizar y procesar texto en español, especialmente en contextos legales, permitiendo a los ordenadores "entender" y comparar el significado de los textos de manera más sofisticada.

littlejohn-alex changed discussion status to closed
littlejohn-alex changed discussion status to open

Sign up or log in to comment