Разбор документов

Извлечение и структурирование информации из типовых документов
01

Задачи

Определение типа документа.

Извлечение ключевой информации из текста документа.
Проверка на документа на соответствие стандарту (проверка признаков, подлежащих обязательному контролю).
Структурирование и представление извлеченной информации в табличном виде либо в виде записей в базе данных.
02

Кому может быть интересно

Финансовые организации

Банки, страховые компании, заинтересованные в автоматической обработке больших объемов поступающих типовых документов (например, договоры, платежные поручения).

Федеральные и региональные органы исполнительной власти

Организации, взаимодействующие с большим количеством физических и юридических лиц, направляющих им документы (договоры, акты, справки, отчеты, заявления) посредством личного кабинета или по иным каналам. 

Провайдеры информационно-аналитических услуг

Компании, заинтересованные в автоматизации разбора и структурирования потока информации, загружаемой из внешних источников, например - решения арбитражных судов и судов общей юрисдикции, решения ФАС, вестник государственной регистрации и т.п.
03

Как решаем

Определение типа документа

  • Поиск явного указания на тип документа.
  • Классификация документов на основе лексических профилей.
  • Машинное обучение на обучающих выборках.

Выделение ключевой информации

  • Реквизиты документа
  • Извлеченные объекты (физические лица, организации, объекты недвижимости, географический объекты), их роли (например, заказчик, исполнитель, продавец, покупатель и  т.п.) и их свойства (например, организационно-правовая форма, ИНН, и т.п.), а также прочие сущности (даты, номера, денежные суммы, адреса, номера счетов и т.п.)

Точная идентификация объектов

  • Объекты идентифицируются по имени, по свойствам, а при необходимости, производится также проверка и связывание с внешними реестрами (при их наличии).
  • Устранение дублей (различные упоминания одного и того же объекта заменяются на одну нормализованную форму наименования).

Анализ и представление результатов

  • Проверка признаков документа (наличие объектов и иных сущностей, подлежащих обязательному контролю, и их соответствие заданным требованиям).
  • Формирование результата обработки документа в структурированном виде (это может быть таблица, структура JSON, записи в базе данных).
05

Примеры

Банк

К нам обратился банк, заинтересованный в автоматизации обработки платежных поручений и извлечения из них информации, необходимой для оценки рисков. Мы разработали систему, которая извлекает, идентифицирует, приводит к стандартной форме, и классифицирует все данные, которые содержатся в платежном поручении - участники, реквизиты операции, назначение платежа. Это позволило заказчику улучшить систему оценки рисков за счет расчета статистических данных по видам операций, построения и анализа профилей входящих и исходящих платежей клиентов.

Подберём продукты
и решения для вашей задачи

Заполните форму и мы свяжемся с вами для консультации о продуктах и решениях RCO
Подпишитесь на обновления о наших последних разработках

© ООО «ЭР СИ О», 2024. Все права защищены

Политика конфиденциальности

Карта сайта

Россия, 119270, г. Москва, Лужнецкая наб., д. 6, стр.1 , офис 214

Телефон: +7 (495) 287-98-87 

E-mail: 

info@rco.ru

© ООО «ЭР СИ О», 2024. Все права защищены

Политика конфиденциальности

Карта сайта

Россия, 119270, г. Москва, Лужнецкая наб., д. 6, стр.1 , офис 214

Телефон: +7 (495) 287-98-87 

E-mail: info@rco.ru

Подпишитесь на обновления о наших последних разработках

Я согласен на обработку персональных данных

Оставить заявку

Укажите интересующий Вас продукт*

Отправляя сведения через электронную форму, вы даете согласие на обработку, сбор, хранение представленной вами информации на условиях Политики конфиденциальности

Оставить заявку

Отправляя сведения через электронную форму, вы даете согласие на обработку, сбор, хранение представленной вами информации на условиях Политики конфиденциальности