File size: 1,605 Bytes
e03ee1d
 
 
 
 
 
 
a740441
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
---
datasets:
- Akajackson/donut_synthdog_rus
language:
- ru
- en
---
## Описание модели
Модель Donut (end-to-end transformer) для распознавания текстов на русском языке.  
https://github.com/clovaai/donut  

Для обучения сгенерирован датасет SynthDoG из 100тыс изображений, с текстами, взятыми из произведений русской литературы.  
https://huggingface.co/datasets/Akajackson/donut_synthdog_rus  

Модель обучена на ноутбуке от уважаемого NielsRogge с заменой оригинального токенайзера на DeepPavlov/xlm-roberta-large-en-ru на площадке Kaggle.   
https://github.com/NielsRogge/Transformers-Tutorials/blob/master/Donut/CORD/Fine_tune_Donut_on_a_custom_dataset_(CORD)_with_PyTorch_Lightning.ipynb  

Метрика на валидации Normed ED: 0.04597701149425287.  

## Возможности модели
Данная модель является базовой для следующих задач:
* распознавание различных типов документов;
* ответы на вопросы по документу;
* классификация документов.

Для решения Вашей задачи возможно использовать выше упомянутые ноутбуки.  
Датасет необходимо разметить в формате, который указан в репозитории Donut.