Dbrain
Search
K

Базовый OCR

Возвращаем весь найденный текст из любых изображений документов
Рассказываем про сервис, чтобы вы понимали его возможности. Воспользоваться им пока что нельзя.
«Базовый OCR» подойдёт для случаев, когда вам не нужны структурированные данные из документа, а нужно просто извлечь весь текст. Сервис поможет, когда нужно организовать поиск по документу, например по книге.
Если вам нужны структурированные данные из документа, воспользуйтесь сервисом «Извлечение данных».
Чтобы воспользоваться сервисом, отправьте POST-запрос на URL https://latest.dbrain.io/basic_ocr

Параметры запроса к API

Движок извлечения текста

engine — string

  • Поведение по умолчанию: i — основной движок извлечения текста, работает в локальных версиях сервиса. Мы не рекомендуем менять этот параметр без прямого указания от нашей службы поддержки.
  • y — альтернативный движок извлечения текста, работает только в облачной версии решения.
  • g — второй альтернативный движок извлечения текста, работает только в облачной версии решения.

Язык извлечения текста

language — string

  • Поведение по умолчанию: rus — русский язык.
  • eng — английский язык.
  • any — смесь русского и английского текста, а также другие языки.

Рукописный текст

handwritten — boolean

  • Поведение по умолчанию: false — сервис ожидает документ, в котором содержится только печатный текст
  • true — сервис ожидает документ, в котором содержатся рукописные символы

Возврат изображений

return_images — boolean

  • Поведение по умолчанию: false — сервис не возвращает изображения слов
  • true — сервис возвращает изображения слов
Перед началом работы с сервисами, советуем заглянуть в раздел «Общая информация о сервисах». В нем перечислили форматы файлов, которые поддерживают сервисы, описали общие для всех сервисов параметры API, а также расшифровали коды ошибок.

В ответе на запрос API:

  • task_id — идентификатор запроса, формат: 32 символа, 16-ричная строка
  • pages — массив, содержащий страницы документа
    • letters — массив, который содержит найденные на странице буквы
      • letter — текст буквы
      • confidence — уровень уверенности алгоритма в корректности извлечения текста буквы
    • words — массив, который содержит найденные на странице слова
      • word — текст слова
      • confidence — уровень уверенности алгоритма в корректности извлечения текста слова
      • coords — координаты слова на странице по четырём точкам: верхний левый угол, верхний правый, нижний левый, нижний правый
      • image — изображение слова в формате base64
    • blocks — массив, который содержит найденные на странице блоки текста — например абзацы
      • block — текст блока
      • confidence — уровень уверенности алгоритма в корректности извлечения всего текста в блоке, считается как усреднённый уровень уверенности по словам
      • coords — координаты блока на странице по четырём точкам: верхний левый угол, верхний правый, нижний левый, нижний правый
    • text — массив, который содержит весь найденный на странице текст
      • text — весь текст на странице
      • confidence — уровень уверенности алгоритма в корректности извлечения всего текста в блоке, считается как усреднённый уровень уверенности по словам
      • coords — координаты текста на документе по четырём точкам: верхний левый угол, верхний правый, нижний левый, нижний правый
  • task_tags — теги, если они переданы в параметре task_tags
  • page_count — число страниц в файле, актуально для PDF и DJVU
  • traceback — сообщение об ошибке, которое содержит информацию о том, где произошла ошибка в коде и какие функции были вызваны перед ней. Это сообщение может помочь разработчикам понять причину возникновения ошибки и исправить ее. Передайте её нашей службе поддержки.
Остальные поля не несут практического смысла. Оставили их для совместимости со старыми версиями.
Last modified 1mo ago