OCR
Opciones
Idioma del documento
Idioma de Tesseract para mejorar el reconocimiento


Separador

Saltos de línea

Puede tardar varios minutos · resultado en ZIP
🔍
Haz clic o arrastra un PDF escaneado aquí
Máximo 1 GB · PDFs con imágenes (escaneados)
Subiendo...
PDF

Estado del servicio OCR
Verificando servicio Apache Tika...
Procesando OCR
Iniciando... 0%

Utiliza Apache Tika (apache/tika:latest-full) con Tesseract OCR para leer PDFs escaneados.

Para PDFs con texto real incrustado, usar PDF a CSV (más rápido).

Los CSV resultantes usan utf-8-bom, compatible con Excel.

⚠ El procesamiento OCR puede tardar entre 1 y 10 minutos según el tamaño del PDF. No cerrar la pestaña durante el proceso.