Skip to main content

OCR (Reconhecimento de Texto)

O serviço de OCR (Optical Character Recognition) permite transformar imagens ou PDFs não pesquisáveis em texto estruturado.

Endpoint

POST /api/v1/pdf/ocr

Funcionalidades

Extração Full-Text: Retorna todo o texto encontrado no documento.
PDF Pesquisável (Searchable PDF): Gera uma nova versão do PDF onde o texto pode ser selecionado e copiado (camada de texto invisível sobre a imagem).

Parâmetros

{
  "fileUrl": "https://...",
  "language": "por", // eng, spa, por
  "outputFormat": "text" // ou "pdf"
}

Aplicações

Automação de Contas a Pagar (leitura de faturas digitalizadas).
KYC (Know Your Customer) - extração de dados de CNH/RG.
Indexação de arquivos legados.

Endpoint
Funcionalidades
Parâmetros
Aplicações