donut_rus / README.md
Akajackson's picture
Update README.md
badf8b6
|
raw
history blame
1.59 kB
metadata
datasets:
  - Akajackson/donut_synthdog_rus
language:
  - ru
  - en

Описание модели

Модель Donut (end-to-end transformer) для распознавания текстов на русском языке.
https://github.com/clovaai/donut

Для обучения сгенерирован датасет SynthDoG из 100тыс изображений, с текстами, взятыми из произведений русской литературы.
https://huggingface.co/datasets/Akajackson/donut_synthdog_rus

Модель обучена на ноутбуке от уважаемого NielsRogge с заменой оригинального токенайзера на DeepPavlov/xlm-roberta-large-en-ru на площадке Kaggle.
https://github.com/NielsRogge/Transformers-Tutorials/blob/master/Donut/CORD/Fine_tune_Donut_on_a_custom_dataset_(CORD)_with_PyTorch_Lightning.ipynb

Метрика на валидации Normed ED: 0.03514.

Возможности модели

Данная модель является базовой для следующих задач:

  • распознавание различных типов документов;
  • ответы на вопросы по документу;
  • классификация документов.

Для решения Вашей задачи возможно использовать выше упомянутые ноутбуки.
Датасет необходимо разметить в формате, который указан в репозитории Donut.