Dbrain
Ask or search…
K
Comment on page

Селфи-чек

Сравниваем лицо человека с лицом на фотографии в документе в рамках одного изображения
Рассказываем про сервис, чтобы вы понимали его возможности. Воспользоваться им пока что нельзя.
Сервис предназначен для обработки селфи с документами — фотографий, где видно лицо человека и документ, который он держит в руках. Дополнительно сервис проверяет, что человек предоставил именно тот тип документа, который вы ожидали, а также сообщает дополнительную информацию о положении головы, глазах и рте.
Когда сервис заработает, вам понадобится эта информация:
Чтобы воспользоваться сервисом, отправьте POST-запрос на URL https://latest.dbrain.io/face_selfie

Параметры запроса к сервису

Режим работы сервиса

mode — string

Поведение по умолчанию: mode=default — сервис ищет на изображении документ, определяет расположение фотографии внутри документа и сравнивает с лицом человека.
Если вы хотите сравнить два лица на одном изображении, передайте параметр mode=simple.

Ожидаемый тип документа

doc_type — string

Поведение по умолчанию: doc_type=passport_main — сервис ожидает изображение с главным разворотом паспорта РФ. Другие допустимые варианты doc_type перечислены в разделе «Типы документов». Передайте doc_type=other если хотите проверить фотографию из документа, с которым не знаком наш сервис.
В режиме mode=simple параметр игнорируется.

Возврат найденных областей изображения

return_crops — в данный момент не работает
Поведение по умолчанию: return_crops=false — сервис не возвращает найденные области изображения.
Если вам нужны найденные сервисом области изображения, укажите return_crops=true. Сервис вернёт в ответе API в параметре crop найденные области изображения с лицами и документами.
Перед началом работы с сервисами, советуем заглянуть в раздел «Общая информация о сервисах». В нем перечислили форматы файлов, которые поддерживают сервисы, описали общие для всех сервисов параметры API, а также расшифровали коды ошибок.

В ответе на запрос API:

Иллюстрация к понятиям yaw, pitch и roll
  • task_id — идентификатор запроса
  • items — массив, содержащий смысловую часть ответа сервиса
    • distance — number от 0 до 1, чем больше число, тем сильнее различаются лица
    • same_face — boolean
      • true — если distance меньше 0.8
      • false — если distance больше или равен 0.8
    • reason — текстовое описание ошибки; возможные значения:
      • More than two face detected — найдено более 2 лиц
      • No face detected on image — лицо вне документа не найдено
      • No face photo detected in document — фотография с лицом в документе не найдена
      • No document detected on image — на изображении не найден документ
      • Document type doesn't match requested — найденный тип документа не соответствует ожидаемому
      • Head yaw is too high — поворот головы относительно вертикальной оси превышает ±5 градусов (здесь и далее ISO/IEC 19794-5)
      • Head pitch is too high — наклон головы вверх или вниз относительно горизонтальной оси, проведённой через уши превышает ±5 градусов
      • Head roll is too high — наклон головы налево или направо относительно горизонтальной оси, проведённой через нос превышает ±5 градусов
      • Left eye closed — левый глаз закрыт
      • Left eye occluded — левый глаз заслонён более чем на 5%
      • Right eye closed — правый глаз закрыт
      • Right eye occluded — правый глаз заслонён более чем на 5%
      • Mouth occluded — рот заслонён более чем на 5%
    • faces и faces_on_document — объекты, содержащие информацию о лице человека и о лице с фотографии в документе соответственно:
      • confidence — number от 0 до 1, уровень уверенности модели, что на изображении найдено именно лицо, а не что-то другое
      • rotation — integer, в котором закодирована ориентация лица
        • 0 — поворот не требуется
        • 1 — требуется поворот на 90 градусов
        • 2 — требуется поворот на 180 градусов
        • 3 — требуется поворот на 270 градусов
      • crop — $string, изображение лица в формате base64
      • coords — массив, координаты документа на изображении по четырём точкам: верхний левый угол, верхний правый, нижний левый, нижний правый
      • head — объект, содержащий оценку положения головы в трёх измерениях
        • yaw — number от -180 до 180: оценка поворота головы налево или направо относительно вертикальной оси, где 0 — нет поворота.
        • pitch — number от -180 до 180: оценка наклона головы вверх или вниз относительно горизонтальной оси, проведённой через уши, где 0 — нет наклона.
        • roll — number от -180 до 180: оценка наклона головы налево или направо относительно горизонтальной оси, проведённой через нос, где 0 — нет наклона.
      • left_eye — объект, содержащий оценку левого глаза
        • open — true/false, где true — глаз открыт
        • occluded — number от 0 до 1, где 0 — глаз ничем не заслонён, а 1 — глаз полностью заслонён
      • right_eye — объект, содержащий оценку правого глаза
        • open — true/false, где true — глаз открыт
        • occluded — number от 0 до 1, где 0 — глаз ничем не заслонён, а 1 — глаз полностью заслонён
      • mouth — объект, содержащий оценку рта
        • occluded — number от 0 до 1, где 0 — рот ничем не закрыт, а 1 — рот полностью закрыт
  • task_tags — теги, если они переданы в параметре task_tags
  • page_count — число страниц в файле, актуально для PDF и DJVU
  • traceback — сообщение об ошибке. Содержит информацию о том, где произошла ошибка в коде и какие функции были вызваны перед ней. Это сообщение может помочь разработчикам понять причину возникновения ошибки и исправить ее. Передайте сообщение нашей службе поддержки в телеграм.
Остальные поля не несут практического смысла. Оставили их для совместимости со старыми версиями.
Last modified 17d ago