Базовый OCR
Возвращаем весь найденный текст из любых изображений документов
Рассказываем про сервис, чтобы вы понимали его возможности. Воспользоваться им пока что нельзя.
«Базовый OCR» подойдёт для случаев, когда вам не нужны структурированные данные из документа, а нужно просто извлечь весь текст. Сервис поможет, когда нужно организовать поиск по документу, например по книге.
Чтобы воспользоваться сервисом, отправьте POST-запрос на URL
https://latest.dbrain.io/basic_ocr
- Поведение по умолчанию:
i
— основной движок извлечения текста, работает в локальных версиях сервиса. Мы не рекомендуем менять этот параметр без прямого указания от нашей службы поддержки. y
— альтернативный движок извлечения текста, работает только в облачной версии решения.g
— второй альтернативный движок извлечения текста, работает только в облачной версии решения.
- Поведение по умолчанию:
rus
— русский язык. eng
— английский язык.any
— смесь русского и английского текста, а также другие языки.
- Поведение по умолчанию:
false
— сервис ожидает документ, в котором содержится только печатный текст true
— сервис ожидает документ, в котором содержатся рукописные символы
- Поведение по умолчанию:
false
— сервис не возвращает изображения слов true
— сервис возвращает изображения слов
Перед началом работы с сервисами, советуем заглянуть в раздел «Общая информация о сервисах». В нем перечислили форматы файлов, которые поддерживают сервисы, описали общие для всех сервисов параметры API, а также расшифровали коды ошибок.
task_id
— идентификатор запроса, формат: 32 символа, 16-ричная строкаpages
— массив, содержащий страницы документаletters
— массив, который содержит найденные на странице буквыletter
— текст буквыconfidence
— уровень уверенности алгоритма в корректности извлечения текста буквы
words
— массив, который содержит найденные на странице словаword
— текст словаconfidence
— уровень уверенности алгоритма в корректности извлечения текста словаcoords
— координаты слова на странице по четырём точкам: верхний левый угол, верхний правый, нижний левый, нижний правыйimage
— изображение слова в формате base64
blocks
— массив, который содержит найденные на странице блоки текста — например абзацыblock
— текст блокаconfidence
— уровень уверенности алгоритма в корректности извлечения всего текста в блоке, считается как усреднённый уровень уверенности по словамcoords
— координаты блока на странице по четырём точкам: верхний левый угол, верхний правый, нижний левый, нижний правый
text
— массив, который содержит весь найденный на странице текстtext
— весь текст на страницеconfidence
— уровень уверенности алгоритма в корректности извлечения всего текста в блоке, считается как усреднённый уровень уверенности по словамcoords
— координаты текста на документе по четырём точкам: верхний левый угол, верхний правый, нижний левый, нижний правый
task_tags
— теги, если они переданы в параметре task_tagspage_count
— число страниц в файле, актуально для PDF и DJVUtraceback
— сообщение об ошибке, которое содержит информацию о том, где произошла ошибка в коде и какие функции были вызваны перед ней. Это сообщение может помочь разработчикам понять причину возникновения ошибки и исправить ее. Передайте её нашей службе поддержки.
Остальные поля не несут практ ического смысла. Оставили их для совместимости со старыми версиями.
Last modified 1mo ago