FAQ

Какие форматы файлов поддерживает Dbrain?

Dbrain гарантирует обработку файлов форматов JPEG (JPG), PNG, BMP и многостраничных файлов форматов PDF, DJVU, TIFF, GIF. Другие растровые графические форматы скорее всего будут работать, но официально не поддерживаются.

Будет ли распознано несколько документов на одной странице? Что произойдёт, если на одном скане лежит сразу и паспорт, и водительское удостоверение?

Dbrain корректно обрабатывает случаи с несколькими документами на одном изображении. Каждый документ будет вырезан, типизирован и сориентирован в пространстве. Если в запросе в параметре doc_type указаны целевые документы, например паспорт России и водительское удостоверение 2011 года, и такие документы найдены классификатором на изображении, они будут распознаны.

В какой кодировке вы возвращаете ответ?

В ответах формата JSON используется кодировка UTF-8.

Есть ли у вас дистрибутив/ библиотека?

Dbrain — серверное решение, которое распространяется в виде докер-контейнера для развёртывания

Хочу получить только результаты распознавания. Мне нужно сначала запрашивать классификатор документов?

Нет, запрашивать классификатор не обязательно. Вы можете сразу запросить эндпоинт /recognize перечислив в параметре doc_type все интересующие вас виды документов. Другие типы документов в запросе будут проигнорированы и не повлияют на счётчик лицензий.

У меня ничего не работает. Хочу понять, на какой стороне проблема. Есть ли способ это сделать?

Да, вы можете проверить работоспособность Dbrain следующим запросом:

# локальная версия
curl -si "http://127.0.0.1:8080/healthcheck"
# облачная версия
curl -si "https://latest.dbrain.io/healthcheck"

Если всё хорошо, в ответ вы получите статус-код 204.

Почему наши данные по числу запросов к Dbrain не сходятся с выставленным нам счётом?

Мы выставляем счёт исходя из суммы распознанных документов, а не запросов. Один запрос может содержать в себе много страниц, а каждая из страниц может содержать несколько документов. Например в запросе может быть многостраничный PDF-файл с несколькими документами на каждой из страниц: на первой странице лежит скан паспорта и водительских прав, на второй — СТС и ПТС, на третьей — европротокол. Таким образом в одном запросе будет 3 страницы и 5 документов.

Чтобы дать возможность осуществлять сверку по числу документов, Dbrain возвращает в ответе на запрос распознавания число найденных страниц и число документов. Для примера выше эти параметры выглядят так:

"pages_count": 3,
"docs_count": 5

Вы можете сохранять эти числа по каждому из запросов на своей стороне, чтобы в конце месяца свериться с нашим счётом.