Comment on page
Классификация документов
Проверяем наличие требуемого списка документов в файле и аккуратно раскладываем по типам

«Классификация документов» поможет в обработке многостраничных сканов с поточного сканера или в предварительной обработке заявки на налоговый вычет. Он пригодится и в простых случаях, когда нужно убедиться, что на изображении именно тот документ, который вы запрашивали.
- 1.Работает и с фотографиями, и со сканами документов.
- 2.Находит на изображении все документы, даже если на одном скане будет паспорт, СНИЛС и водительские права.
- 3.Отделяет документы от фона, например от бабушкиного ковра или от ваших рук.
- 4.Поворачивает и при необходимости зеркально отражает.
- 5.Присваивает тип каждому найденному документу. Все документы, которые сейчас умеем классифицировать и распознавать перечислили в разделе «Типы документов».
Обратите внимание на специальные типы документов, которые возвращает классификатор:
- other — документ неизвестного типа;
- not_document — не документ, например, фото кота;
- empty — пустая страница.
Описали популярные способы взаимодействия с сервисом. Для любого из них вам потребуется ключ лицензии. Чтобы п олучить ключ, напишите нам в телеграм или на [email protected].
Подготовьте изображение документа для теста. Если у вас такого нет, используйте паспорт РФ из Википедии.
Обратитесь к методу
/classify
по адресу latest.dbrain.io. В этом способе только два обязательных параметра:token
— ваш ключ лицензииimage
— файл с изображением документа
Таким образом, curl запрос должен выглядеть так:
curl -X 'POST' \
'https://latest.dbrain.io/classify?token=xxx' \
-H 'accept: application/json' \
-H 'Content-Type: multipart/form-data' \
-F '[email protected];type=image/jpeg'
- Подготовьте ваш ключ лицензии.
- Введите свой токен в любое поле и нажмите
Authorize
- Прокрутите вниз до раздела
Documents
, нажмите на метод/classify
- В открывшемся разделе нажмите на кнопку
Try it out
- Прокрутите страницу вниз до раздела
Request body
- Нажмите на кнопку
Выберите файл
пунктаimage
- Укажите изображение, которое нужно распознать
- Нажмите кнопку
Execute
- Ответ сервиса появится в пункте
Response body
разделаResponses
- Полученный на этом этапе
Curl
мы рекомендуем использовать как основу для написания интеграции с API сервиса Dbrain.
- 1.
- 2.Введите ключ лицензии в поле «Введите токен»
- 3.Нажмите кнопку «Выберите файлы для распознавания»
- 4.Укажите изображение, которое нужно распознать
- 5.Нажмите кнопку «Классифицировать»
import requests
url = 'https://latest.dbrain.io/classify?token=xxx'
files = {'image': open('image.jpg', 'rb')}
headers = {'accept': 'application/json'}
response = requests.post(url, headers=headers, files=files)
Код использует библиотеку
requests
для отправки POST-запроса с файлом изображения. Функция open()
используется для открытия файла изображения в двоичном режиме и передачи его в параметр files
. Параметр headers
используется для установки заголовка accept
в значение application/json
. Ответ от сервера сохраняется в переменной response
.Тело запроса передавайте в кодировке
UTF-8
.return_crops — boolean
Поведение по умолчанию: return_crops
=true
— сервис возвращает изображения найденных документов в параметре crop
.Если вам не нужны найденные сервисом изображен ия документов, например, в целях экономии трафика, укажите return_crops
=false.
Перед началом работы с сервисами, советуем заглянуть в раздел «Общая информация о сервисах». В нем перечислили форматы файлов, которые поддерживают сервисы, описали общие для всех сервисов параметры API, а также расшифровали коды ошибок.
task_id
— string, идентификатор запроса, формат: 32 символа, 16-ричная строкаitems
— массив, который содержит найденные документыdocument
— объект, который содержит один из найденных документовtype
— string, тип найденного документа, возможные типы перечислены в таблице вышеrotation
— integer, ориентация документаcoords
— массив, координаты документа на изображении по четырём точкам: верхний левый угол, верхний правый, нижний левый, нижний правыйpage
— integer, номер страницы, на котором найден документ, актуально для многостраничных форматов, например PDFconfidence
— number, уровень уверенности алгоритма в корректности определения типа документа
crop
— $string, изображение документа, отделённое от фона и правильно ориентированное, в бинарном формате
task_tags
— массив string, теги, если они переданы в параметреtask_tags
page_count
— integer, число страниц в файле, актуально для PDF и DJVUdocs_count
— integer, число распознанных документов в файлеtraceback
— string, сообщение об ошибке, которое содержит информацию о том, где произошла ошибка в коде и какие функции были вызваны перед ней. Это сообщение может помочь разработчикам понять причину возникновения ошибки и исправить ее. Передайте её нашей службе поддержки.
Остальные поля не несут практического смысла. Оставили их для совместимости со старыми версиями.
Last modified 18d ago