Обработка документов и PDF
Конвейер детекции, классификации и извлечения данных из сканов и PDF: распознавание структуры, таблиц и ключевых полей.
Задача
Поток сканов и PDF требовал ручного ввода полей и таблиц — узкое место операционного отдела.
Подход
Построили конвейер: детекция блоков YOLO/ViT, OCR, извлечение структуры LayoutLM и валидация бизнес-правил.
Результат
Большая часть документов проходит без ручного ввода. Операторы проверяют только спорные кейсы.
Результат
Автоматизация ручного ввода документов