Паспорт
Извлекаем данные из паспорта гражданина РФ: главный разворот, стр. 3-4
Актуальная форма паспорта выдаётся с 1 октября 1997 года. С 1 июля 2011 года в паспорте заполняются нижние две строки с машиночитаемыми записями (МЧЗ). Сервис извлекает данные как из визуальных полей, так и из МЧЗ. При выборе между ними, сервис ориентируется на контрольные суммы в МЧЗ и читабельность данных визуальных полей.

Тип документа в API: passport_main
Перечень извлекаемых полей
Серия и номер
series_and_number
4 цифры, пробел, 6 цифр
Имя
first_name
Русский алфавит
Фамилия
surname
Русский алфавит
Отчество
other_names
Русский алфавит
Пол
sex
муж. или жен.
Дата рождения
date_of_birth
дд.мм.гггг
Место рождения
place_of_birth
Русский алфавит
Дата выдачи
date_of_issue
дд.мм.гггг
Код подразделения
subdivision_code
3 цифры, тире, 3 цифры
Паспорт выдан
issuing_authority
Русский алфавит
МЧЗ, строка 1
mrz_1
Латинский алфавит, цифры, <>
МЧЗ, строка 2
mrz_2
Латинский алфавит, цифры, <>
Перед началом работы изучите общее описание сервиса извлечения данных в разделе «Извлечение данных». Ниже мы перечислили лишь уникальные параметры для главного разворота паспорта
Параметры запроса к API
Нормализация поля «Паспорт выдан»
use_internal_api — boolean
async
Назначение: Асинхронная обработка задач. Позволяет отправить задачу в API и получить результат через эндпоинт result.
Состояние: Работает корректно.
return_crops
Назначение: Возвращает бинарное изображение вырезанного из фона и корректно сориентированного документа.
Состояние: Работает корректно.
task_tags
Назначение: Метки задач, позволяющие идентифицировать и организовывать запросы по ключевым словам или строкам. Передается массив тегов.
Состояние: Работает корректно.
address_division
Назначение: Разделение адреса на административные и муниципальные единицы. Используется только для прописок
Состояние: Работает, основное использование — административное деление(районы, муниц. округа).
check_fake
Назначение: Проверка метаданных изображения на подлинность, раньше использовалась в anti-fraud.
Состояние: Перенесен в антифрод, сохранён для обратной совместимости.
check_fake_visual
Назначение: Определение фальшивых изображений, помогает выявить отредактированные документы (например, созданные в Photoshop).
Состояние: Устарел, перенесен в антифрод; Сохранён для обратной совместимости.
classify_image_origin
Назначение: Классификация источника изображения (скан, фото и т.д.).
Состояние: Работает; улучшенная версия теперь интегрирована в антифрод.
doc_type
Назначение: Определение типа документа для фильтрации и классификации. В ответ приходит только указанный тип документа.
Состояние: Работает корректно.
use_internal_api
Назначение: Включение нормализации места выдачи паспорта РФ с использованием внутреннего словаря.
Состояние: Перенесен в антифрод, сохранён для обратной совместимости. используется по умолчанию.
use_iqa (Image Quality Assessment)
Назначение: Оценка качества изображения для проверки его пригодности к распознаванию.
Состояние: Работает; Предназначен для мобильных приложениях.
with_gocr
Назначение: Используется для распознавания текста на языках СНГ и других локальных языках с редкими символами.
Состояние: Работает только в облаке; используется для специфических документов.
Поведение по умолчанию: use_internal_api=true — сервис нормализует поле «Паспорт выдан». Для этого он использует расширенную версию справочника соответствий кода подразделения и места выдачи. Так мы повышаем точность извлечения поля «Паспорт выдан». Поэтому сервис выдаёт корректный результат даже в ситуациях, когда поле полностью нечитабельно.
В крайне редких случаях нормализация может приводить к неточному соответствию результатов распознавания поля «Паспорт выдан» и фактического текста в паспорте. Например, вместо ОТДЕЛОМ УФМС РОССИИ ПО Г. МОСКВЕ ПО РАЙОНУ ЗЮЗИНО сервис может вернуть ОТДЕЛОМ УФМС РОССИИ ПО ГОРОДУ МОСКВЕ ПО РАЙОНУ ЗЮЗИНО.
Мы не рекомендуем, но если вы всё же хотите отключить нормализацию поля «Паспорт выдан», передайте параметр use_internal_api=false
В России нет юридических норм, которые обязывают вас использовать в документах побуквенное воспроизведение поля «Паспорт выдан».
Например, у нашего продакта Артёма текст поля «Паспорт выдан» очень длинный и не влезает ни в одну печатную форму. Что ему делать? Артём всегда использует сокращения.
Для однозначной идентификации места выдачи документа достаточно поля «Код подразделения»
Помимо извлечения данных из паспорта сервис Dbrain умеет:
Last updated
Was this helpful?
