Skip to main content

OCR (Reconhecimento de Texto)

O serviço de OCR (Optical Character Recognition) permite transformar imagens ou PDFs não pesquisáveis em texto estruturado.

Endpoint

POST /api/v1/pdf/ocr

Funcionalidades

  • Extração Full-Text: Retorna todo o texto encontrado no documento.
  • PDF Pesquisável (Searchable PDF): Gera uma nova versão do PDF onde o texto pode ser selecionado e copiado (camada de texto invisível sobre a imagem).

Parâmetros

{
"fileUrl": "https://...",
"language": "por", // eng, spa, por
"outputFormat": "text" // ou "pdf"
}

Aplicações

  • Automação de Contas a Pagar (leitura de faturas digitalizadas).
  • KYC (Know Your Customer) - extração de dados de CNH/RG.
  • Indexação de arquivos legados.