Распознавание документов
Метод /recognize

Алгоритм распознавания документов последовательно обрабатывает изображение: классифицирует документы и распознаёт в них текст.
- 1.Детектор ищет на входящем изображении прямоугольные области, похожие на документы, и вырезает их.
- 2.Классификатор присваивает каждой вырезанной области тип документа: главный разворот паспорта России, водительское удостоверение образца 2011 года, СНИЛС и так далее. По ссылке доступен список поддерживаемых типов документов.
- 3.Классификатор оценивает ориентацию документа в пространстве. При необходимости, поворачивает или зеркально отражает документ.
- 4.Детектор полей находит и вырезает поля документа. Например, в паспорте отдельно вырезаются фамилия, место рождения, серия, номер и остальные поля.
- 5.Алгоритм OCR оцифровывает символы на вырезанном поле документа.
- 6.OCR присваивает результату распознавания «уровень уверенности»
confidence
. - 7.Если включен режим ручного распознавания, модуль HITL обрабатывает пару «вырезанное поле + оцифрованный текст» .
- 8.Оцифрованный текст проходит верификацию по маскам и словарям.
Параметр
confidence
в ответе показывает уровень уверенности алгоритма в корректности распознавания символов.Алгоритм вернёт пустой ответ с нулевым
confidence
, если оцифрованный текст не пройдёт проверку по маскам и словарям. Например, дата рождения «56.12.1988» не попадёт в ответ.Функция сравнивает результаты распознавания полей с текстом из вашего файла. Это полезно, когда вы хотите сверить данные из изображений документов с данными из других источников. Для использования функции дополнительно укажите JSON-файл в параметре
verify_fields
.Ниже показан пример JSON-файла для сравнения серии-номера и ФИО из паспорта РФ с результатами распознавания:
{
"series_and_number": "1111 222222",
"surname": "Иванов",
"first_name": "Иван",
"other_names": "Иванович"
}
Функция сверки возвращает атрибут
"valid"
для каждого поля документа. Допустимые значения атрибута:- "true" — текст поля в JSON-файле и в результатах распознавания совпадают;
- "false" — текст не совпадает;
- "null" — поле отсутствует в JSON-файле.
Помимо этого, функция сверки возвращает атрибут
"levenshtein"
— расстояние Левенштейна для результата распознавания и аналогичного поля из внешнего JSON-файла.Ниже представлена API-спецификация для метода распознавания документов. Подробнее о том, как составить запрос на распознавание, в разделе Подключение и тестирование.
post
https://latest.dbrain.io/recognize
recognize
Last modified 1mo ago