ConheçaoProjeto

⚙️ Instalação e Execução

O código instalará automaticamente todas as dependências necessárias, incluindo OCR e bibliotecas de processamento de imagens.

OCR robusto em português com EasyOCR.
Suporte a imagens (.jpg, .png, .jpeg) e PDFs.
Pré-processamento das imagens para aumentar a precisão do OCR (cinza, contraste, equalização).
Pareamento automático de capas e contracapas.
Pós-processamento de texto, incluindo correção de palavras quebradas e remoção de caracteres inválidos.
Evita duplicidade na planilha, gravando apenas novos arquivos.
Registro dos seguintes campos na planilha:

A pasta de imagens/PDFs deve estar organizada e numerada, seguindo o padrão 1.1.capa, 1.1.contra para manter o pareamento correto.
O OCR funciona melhor em imagens nítidas e legíveis. PDFs digitalizados de baixa qualidade podem precisar de ajuste manual.
É recomendado usar GPU no Colab para acelerar o processamento, especialmente se houver muitas imagens ou PDFs grandes.