RCO Personal Data Extractor

Комплексный инструментарий для выявления и обезличивания персональных данных в неструктурированных текстовых документах.
01

Аннотация

 Базируется на продукте для выявления персональных данных в текстах "RCO Personal Information SDK"  (свидетельство о государственной регистрации программ для ЭВМ №2012612975 от 12 марта 2012 г.).

Предназначен для обезличивания персональных данных в соответствии с Федеральным законом №152-ФЗ от 27.07.2006  (ред. от 08.08.2024).

Соответствует требованиям, установленным приказом Роскомнадзора от 05.09.2013 №996
"Об утверждении требований и методов по обезличиванию персональных данных".

Выявление персональных данных

Продукт обеспечивает выявление более чем 15 различных типов персональных данных в неструктурированных текстовых документах.

Обезличивание

Автоматически осуществляет замену выявленных персональных данных на их кодовые обозначения (набор специальных символов), одновременно обеспечивая сохранение смысловой целостности текста.

Гибкая настройка

Состав выявляемых персональных данных и правила обезличивания могут настраиваться в широком диапазоне.
02

Характеристики

Выявляем в тексте следующие категории персональных данных:

  • фамилии, имена, отчества;
  • год, месяц, дата и место рождения;
  • реквизиты паспорта или иного документа, удостоверяющего личность;
  • идентификационный номер налогоплательщика;
  • государственный регистрационный номер индивидуального предпринимателя;
  • сведения о транспортных средствах;
  • сведения о доходах;
  • сведения об объекте недвижимости;
  • профессия;
  • образование;
  • географические адреса места жительства и/или регистрации;
  • СНИЛС;
  • номера телефонов;
  • адреса электронных почтовых ящиков;
  • данные, относящиеся к медицинской и банковской тайнам;
  • сведения, раскрывающие информацию о персональных данных военнослужащих.

Поддерживаем возможность замены элементов персональных данных не на кодовое обозначение, а на диапазон значений. Например, возраст от 20 до 30 лет

Продукт поддерживает возможность восстановления исходного текста из обезличенного (де-обезличивание), для этого продукт сохраняет дополнительную информацию, связывающую идентификаторы с первоначальными данными. 

Для работы RCO Personal Data Extractor дополнительно требуется приобретение продукта RCO Fact Extractor SDK, так как он используется для извлечения персональных данных и их атрибутов.

Осуществляем замену выявленных персональных данных на их кодовые обозначения (набор специальных символов из настраиваемых шаблонов).

Для сохранения смысловой целостности текста производим замену упоминаний всех персон в тексте на соответствующие кодовые обозначения этих персон, например, Персона 1, Персона 2, …, Персона N (далее Персона i). Для каждой персоны создается ее уникальный идентификатор.

Кодовое обозначение сохраняется при замене упоминаний персоны по всему тексту. Присвоение одной персоне нескольких кодовых обозначений не допускается.

Все выявленные сопутствующие персональные данные заменяются в тексте, и для них осуществляется привязка к персоне с помощью ее кодового обозначения. Например, значения даты рождения персоны, которой присвоен идентификатор i (кодовое обозначение — Персона i) заменяются на Дату рождения Персоны i и т.п. Такая привязка обеспечивает однозначную привязку сопутствующих персональных данных к кодовому обозначению персоны.

Продукт включает модуль распознавания электронных образов документов.

Обрабатываем документы следующих форматов:

  • PDF с текстовым слоем, PDF OCR;
  • DOCX, DOC, OFT, XLSX, XLS;
  • TIFF, JPG, PNG.

В продукте реализовано API для интеграции с внешними системами, осуществляющее прием текста для обработки и выдачу результата. 

03

Примеры использования

Крупный телекоммуникационный оператор


В нашу компанию обратился телекоммуникационный оператор, осуществляющий, в том числе, обработку обращений клиентов (жалобы, вопросы). Поток обращений значительный, и для обработки было решено привлечь сторонние компании. Так как обращения почти всегда содержат персональные данные клиентов оператора, то для передачи "во внешний контур" тексты обращений необходимо было предварительно обезличить. 

Кроме собственно обработки обращений, подготовки ответов, компании-контрагенты производят аналитическую обработку всего массива обращений по заказу оператора и готовят отчеты, классифицируя обращения по разным критериям, обобщают и агрегируют данные, строят статистические отчеты. Для того чтобы подобная аналитическая обработка была возможна, процедура обезличивания должна полностью сохранять семантическую структуру. Например, аналитикам не нужна конкретная дата рождения автора обращения, и она в процессе обезличивания заменяется на определенное кодовое обозначение, но нужен диапазон возрастов (20-30, 30-40 и т.п.). Аналогично, аналитикам не доступен точный адрес проживания, он обезличен, но им интересно знать в каком регионе проживает автор. Для решения подобных задач используются возможности продукта RCO Personal Data Extractor по добавлению диапазонов значений к обезличенным кодовым обозначениям, при желании Заказчика.

Результат обработки обращений поступает обратно в "закрытый контур" оператора, где используя функции продукта RCO Personal Data Extractor по "де-обезличиванию", изначальные персональные данные могут быть восстановлены, при необходимости.

Банк


В нашу компанию обратился банк, которому было необходимо внедрить систему обезличивания массивов текстовых документов, которые предполагалось использовать как выборку для обучения тематического классификатора.  Исходные версии документов, содержащие персональные данные клиентов выносить из "закрытого контура" наружу нельзя, а системы машинного обучения находятся во "внешнем контуре", у подрядчиков. 
При этом, процедура обезличивания должна сохранять семантическую структуру исходного текста, не удаляя персональные данные, а заменяя их на произвольные значения. Это необходимо для корректного обучения тематического классификатора - все статистические и семантические закономерности в обезличенном тексте должны быть сохранены.
04

Технические требования

Платформа

RCO Personal Data Extractor работает на платформе Linux.
05

Система лицензирования

Продукт лицензируется по количеству одновременно работающих экземпляров ПО.  Передача прав использования по лицензионному договору осуществляется на следующих типовых условиях: простая (неисключительная) лицензия, территория использования – Российская Федерация и страны СНГ для использования внутри одного юридического лица.

Актуальный ценовой лист доступен по запросу.

06

Гарантийные обязательства и техническая поддержка

Срок гарантийных обязательств составляет 1 год с момента передачи ПО.

После окончания гарантийного срока, возможно заключение договора технической поддержки ПО, которая включает в себя:
– Консультации;
– Обновление ПО до актуальной версии, по запросу.

Cтоимость технической поддержки составляет 22% от стоимости приобретенных лицензий, в год.*

Также возможно заключение договора расширенной технической поддержки ПО, которая включает в себя создание дополнительных модулей системы, по запросам.

  * В соответствии с актуальным на момент заключения договора прайс-листом, без учета скидок.

07

Документация

Подберём продукты
и решения для вашей задачи

Заполните форму и мы свяжемся с вами для консультации о продуктах и решениях RCO
Подпишитесь на обновления о наших последних разработках

© ООО «ЭР СИ О», 2024. Все права защищены

Политика конфиденциальности

Карта сайта

Россия, 119270, г. Москва, Лужнецкая наб., д. 6, стр.1 , офис 214

Телефон: +7 (495) 287-98-87 

E-mail: 

info@rco.ru

© ООО «ЭР СИ О», 2024. Все права защищены

Политика конфиденциальности

Карта сайта

Россия, 119270, г. Москва, Лужнецкая наб., д. 6, стр.1 , офис 214

Телефон: +7 (495) 287-98-87 

E-mail: info@rco.ru

Подпишитесь на обновления о наших последних разработках

Я согласен на обработку персональных данных

Оставить заявку

Укажите интересующий Вас продукт*
Отправляя сведения через электронную форму, вы даете согласие на обработку, сбор, хранение представленной вами информации на условиях Политики конфиденциальности

Оставить заявку

Отправляя сведения через электронную форму, вы даете согласие на обработку, сбор, хранение представленной вами информации на условиях Политики конфиденциальности