Описание модели

Модель представляет собой дообученную версию nielsr/lilt-xlm-roberta-base для анализа документов, подтверждающих индивидуальные достижения, которая позволит автоматически извлекать важную информацию из отсканированных документов.

Модель способна распознавать следующие классы:

  • Дата получения (DATE)
  • ФИО владельца (FULL_NAME)
  • Тип документа (DOC_TYPE)
  • Причина получения (REASON_OBTAINING)
  • Место, которое занял владелец (PLACE)

Датасет

Датасет PIAD (Parsing Individual Ahievement Documents) включает в себя 215 отсканированных документов, подтверждающих индивидуальные достижения.

PIAD не выложен в открытый доступ, так как некоторые элементы содержат персональные данные.

Ссылки

Downloads last month
20
Safetensors
Model size
284M params
Tensor type
F32
·
Inference Examples
This model does not have enough activity to be deployed to Inference API (serverless) yet. Increase its social visibility and check back later, or deploy to Inference Endpoints (dedicated) instead.