+7 (928) 854-24-62
Isometric Icons (https://www.isocons.app/) ©2026 is licensed under CC BY 4.0(https://creativecommons.org/licenses/by/4.0/?ref=chooser-v1)
Заказать консультацию
УмДок
УмДок
ИИ для работы с документами: как мы ускорили обработку сканов в 5–7 раз
/№
4
Разработка и интеграция CRM. Сфера «Финансы, инвестиции, страхование»
Разработка и интеграция CRM. Сфера «Финансы, инвестиции, страхование»

ИИдляработысдокументами:заменилиручнойвводнаИИ-конвейер

Заказчик — российская строительная компания из Москвы, работающая на рынке промышленного и гражданского строительства РФ. Каждый месяц её операционный блок обрабатывает сотни смет и спецификаций от десятков подрядчиков со всей страны и из-за рубежа. Документы приходят на русском и английском языках — и в этом международном потоке царит полный хаос: разные названия колонок, нестандартная структура таблиц, небрежные сканы и фото вместо нормальных ПДФ. Анализ системы управления документами показал: до 70% времени сотрудников уходит на механический перенос данных.

Задача — убрать ручной перенос данных с помощью корпоративного ИИ для бизнеса, адаптированного под российский рынок и мультиязычную документацию. Сотрудники часами переписывали позиции из хаотичных входящих файлов в корпоративную таблицу. Нужен был сервис, который сам распознаёт сканы, понимает содержимое на разных языках и выдаёт готовый Эксель.

Проблема — на старте мы выявили нюанс, который не был очевиден. Предполагалось, что входные данные — ПДФ с текстовым слоем. По факту — «мёртвые» сканы, просто картинки. Скопировать текст нельзя, сложность выросла кратно. Это меняло архитектуру: требовалось не извлечение текста, а полноценное компьютерное зрение. Мы проверили платный аналог за 20 $/мес: таблицу отрисовывает, но врёт в цифрах и названиях. Для российского бизнеса, где ошибка в одной позиции грозит срывом сроков и финансовыми потерями, автоматизация проверки документов была обязательным требованием.

С чего мы начали — мы решили строить не готовый продукт сразу, а прототип: проверить ключевую механику распознавания и сопоставления, показать заказчику работающий конвейер и собрать обратную связь. Никаких жёстких требований к дизайну, удобству интерфейса и масштабируемости на этом этапе не было — только точность распознавания и корректность выгрузки. Такой подход позволял двигаться быстро и не перегружать первый этап лишними трудозатратами.

Организационный момент — именно поэтому весь проект, от серверной логики до интерфейса, делал один разработчик. Поскольку на этапе прототипа не требовалась глубокая фронтенд-проработка, мы использовали генерацию кода для создания интерфейса. Это позволило не привлекать отдельного фронтенд-специалиста и сосредоточить ресурсы на ключевой задаче — точности ИИ-конвейера.

Решение — поэтапный конвейер для ИИ-обработки документов, работающий с русскоязычными и международными сканами. Компьютерное зрение находит таблицу на картинке и извлекает сырой текст. Нейросеть сопоставляет колонки по смыслу и разделяет слипшиеся данные. Между этапами — экран верификации, где пользователь может поправить распознанное до выгрузки.

Результат — прототип превращает фото спецификации в заполненный Эксельl за минуты. Московский заказчик, годами делавший это руками, был готов к 30% точности — мы превзошли этот порог. Использование генерации кода на этапе прототипирования дало кратный прирост в скорости: интерфейс, достаточный для демонстрации и сбора обратной связи, был собран за часы. При этом мы отдаём себе отчёт: для перехода от прототипа к стабильному, готовому к эксплуатации продукту сгенерированный код должен пройти профессиональное ревью — без этого накапливаются технические ошибки и падает поддерживаемость.

Подробнее о том, как устроен конвейер и почему ИИ не работает без человека:

Счеговсёначалось:ложнаягипотеза

Изображение С чего всё началось: ложная гипотеза

Всё выглядело просто: есть ПДФ, в них текст, мы его извлекаем и раскладываем. Но заказчик работал не с «цифровыми» документами, а со сканами — изображениями без текстового слоя. Так мы поняли: чтобы создать работающий ИИ для работы с документами, нужно не «прочитать», а «увидеть» и «понять» содержимое.

Задача из рутинной превратилась в исследовательскую. Мы проверили платный сервис: границы таблиц он рисовал неплохо, но ошибался в содержании — пропускал цифры, путал надписи. Для процесса, где одна ошибка может потянуть за собой финансовые потери, критически важна автоматизация проверки документов на всех этапах. Решили строить свой пайплайн.

КакустроенконвейерИИдляработысдокументами

Изображение Как устроен конвейер ИИ для работы с документами

Этап 1. Извлечение сырых данных

Пользователь загружает изображение и выделяет область с таблицей — на листе могут быть печати, заметки, подписи. Дальше в дело вступает компьютерное зрение: алгоритмы нормализуют картинку, находят строки и столбцы, извлекают текст. Это черновая работа — на выходе просто набор данных, без понимания их смысла. Мы перебрали несколько OCR-библиотек, чтобы найти самую точную.

Этап 2. Интеллектуальное сопоставление

Здесь начинает работать нейросеть — ключевой элемент корпоративного ИИ для бизнеса. Она получает две сущности: список колонок из входящего документа и список колонок целевой таблицы заказчика. Задача — найти смысловые соответствия.

Пример: «Масса единицы» у поставщика — это «Вес изделия» у заказчика. Или сложнее: «Труба ДН677 600» — это не одна колонка, а две. «Труба» — наименование, «ДН677 600» — техническая характеристика. Нейросеть сама разделяет такие данные и распределяет по нужным полям. Оркестрация — через LangChain, модели — ЯндексGPT и GigaChat.

Этап 3. Страховочный пояс: верификация

Мы не обещаем 100% точности — это технологически невозможно, и ни один сервис в мире её не даёт. Поэтому автоматизация проверки документов встроена прямо в интерфейс: пользователь видит, что распозналось, сверяет с исходной картинкой и может поправить ошибки.

Удалить лишнюю строку, переименовать колонку, подставить пропущенное — всё это делается за секунды. Документ, на который раньше уходил час ручного труда, обрабатывается за несколько минут. Финальный результат гарантированно корректен.

Этап 4. Выгрузка

Пользователь нажимает «подтвердить» и скачивает готовый Эксель в едином корпоративном формате. Анализ системы управления документами подтверждает: время обработки сокращается в 5–7 раз.

ВнедритьИИвобработкудокументов?
Поможем с этапа гипотезы до продакшена.

Генерациякодакакинженерныйинструмент

Фронтенд проекта построен с помощью генерации кода на Флаттер. Это было осознанное технологическое решение: разработчик описывал интерфейс, ИИ генерировал код, который затем проходил ревью и дорабатывался. Такой подход позволил реализовать весь проект силами одного специалиста и кратно сократить время прототипирования.

За часы можно собрать интерфейс, пригодный для демонстрации заказчику и сбора обратной связи. Это ускоряет проверку гипотез на ранних этапах.

Но есть и важное ограничение. ИИ не чистит за собой код — дописывает новый поверх старого, не удаляя неиспользуемое. Кодовая база быстро распухает. Разработчик без профильной экспертизы не может оценить качество и заметить неоптимальности.

Вывод: для быстрого МВП и демо генерация кода — эффективный инструмент. Для стабильного, масштабируемого корпоративного ИИ для бизнеса — код должен проходить профессиональное ревью. Это наше принципиальное требование к качеству продукта.

Чтополучилось

Генерация кода с помощью ИИ отлично показала себя для быстрого прототипирования. За часы можно собрать интерфейс, пригодный для демонстрации заказчику и сбора обратной связи. Это кратно ускоряет проверку гипотез на ранних этапах.

Но есть и критичное ограничение. Нейросеть не чистит за собой код — дописывает новый поверх старого, не удаляя неиспользуемое. Кодовая база быстро распухает. Разработчик без профильной экспертизы не может оценить качество и заметить неоптимальности.

Изображение Что получилось

Вывод: для быстрого МВП и демо — находка. Для стабильного, масштабируемого корпоративного решения — сгенерированный код должен проходить профессиональное ревью фронтенд-команды. Исключать человека из процесса пока рано.

Результатиреакциязаказчика

Изображение Результат и реакция заказчика

Мы показали прототип ИИ для работы с документами. Заказчик был приятно удивлён: человек годами делал это руками и был готов, что машина осилит хотя бы 30% — и уже этим сэкономит время. Фактическая точность оказалась значительно выше ожиданий. Заказчик увидел: можно не переписывать таблицы, а загружать фото и получать готовый результат с возможностью точечной корректировки.

Перспективытехнологии

Конвейер, построенный для стройки, не привязан к одной отрасли. Та же задача — нестандартизированные документы от разных контрагентов, которые нужно приводить к единому формату, — есть в логистике, гостиничном бизнесе, финансах. Масштабирование корпоративного ИИ для бизнеса на другие индустрии — вопрос адаптации нейросетевого слоя под новую доменную модель.

Ищетекоманду,котораярешитзадачусдокументами,анепростонапишеткод?

Этот кейс показывает, как мы работаем, когда реальность расходится с ожиданиями:

  • Не обещаем 100% автоматизации там, где это невозможно, — встраиваем верификацию.

  • Не берём готовое ТЗ — помогаем сформировать на основе боли бизнеса.

  • Не гонимся за всеми фичами сразу — запускаем прототип, проверяем, достраиваем.

  • Архитектуру закладываем под масштабирование на другие отрасли — от стройки до логистики.

  • Сталкиваемся с мёртвыми сканами и зоопарком форматов — строим конвейер компьютерного зрения + LLM.

  • Когда платные сервисы врут в цифрах — делаем своё и даём человеку право на исправление.

Вам нужен не просто сервис для распознавания, а работающий инструмент, который сократит 70% рутины? Оставляйте заявку.

Технологии

Isometric Icons (https://www.isocons.app/) ©2026 is licensed under CC BY 4.0(https://creativecommons.org/licenses/by/4.0/?ref=chooser-v1)
Фронтенд-разработка
Flutter
Isometric Icons (https://www.isocons.app/) ©2026 is licensed under CC BY 4.0(https://creativecommons.org/licenses/by/4.0/?ref=chooser-v1)
Бэкенд-разработка
Python
FastAPI
Isometric Icons (https://www.isocons.app/) ©2026 is licensed under CC BY 4.0(https://creativecommons.org/licenses/by/4.0/?ref=chooser-v1)
Интеграции и фреймворки
LangChain

Оставитьзаявку

Телефон
Telegram
Max
Почта
Другое
менее 1 млн. ₽
1 млн. - 5 млн. ₽
5 млн - 10 млн. ₽
более 10 млн. ₽
Файл не выбран
Допустимые форматы: jpg, jpeg, png, webp, heif, docx, pdf, txt.
Объем загружаемого файла не должен превышать 5 Мб
Напишите на email
hello@itfox-web.com
Позвоните по номеру
+7 (928) 854-24-62
или расскажите о проекте оставив заявку
Isometric Icons (https://www.isocons.app/) ©2026 is licensed under CC BY 4.0(https://creativecommons.org/licenses/by/4.0/?ref=chooser-v1)
Поможем, даже если у вас нет технического задания
Isometric Icons (https://www.isocons.app/) ©2026 is licensed under CC BY 4.0(https://creativecommons.org/licenses/by/4.0/?ref=chooser-v1)
Определим стоимость разработки
Isometric Icons (https://www.isocons.app/) ©2026 is licensed under CC BY 4.0(https://creativecommons.org/licenses/by/4.0/?ref=chooser-v1)
Предложим способы снижения затрат на проект без потери качества
Isometric Icons (https://www.isocons.app/) ©2026 is licensed under CC BY 4.0(https://creativecommons.org/licenses/by/4.0/?ref=chooser-v1)
Дадим рекомендации по повышению эффективности вашего проекта