OCR (Reconhecimento de Texto)
O serviço de OCR (Optical Character Recognition) permite transformar imagens ou PDFs não pesquisáveis em texto estruturado.
Endpoint
POST /api/v1/pdf/ocr
Funcionalidades
- Extração Full-Text: Retorna todo o texto encontrado no documento.
- PDF Pesquisável (Searchable PDF): Gera uma nova versão do PDF onde o texto pode ser selecionado e copiado (camada de texto invisível sobre a imagem).
Parâmetros
{
"fileUrl": "https://...",
"language": "por", // eng, spa, por
"outputFormat": "text" // ou "pdf"
}
Aplicações
- Automação de Contas a Pagar (leitura de faturas digitalizadas).
- KYC (Know Your Customer) - extração de dados de CNH/RG.
- Indexação de arquivos legados.