OCR
🔍
Haz clic o arrastra un PDF escaneado aquí
Máximo 1 GB · PDFs con imágenes (escaneados)
Subiendo...
PDF

Estado del servicio OCR
Verificando servicio Apache Tika...
Procesando OCR
Iniciando... 0%

Utiliza Apache Tika (apache/tika:latest-full) con Tesseract OCR para leer PDFs escaneados.

Para PDFs con texto real incrustado, usar PDF a CSV (más rápido).

Los CSV resultantes usan utf-8-bom, compatible con Excel.

⚠ El procesamiento OCR puede tardar entre 1 y 10 minutos según el tamaño del PDF. No cerrar la pestaña durante el proceso.
Opciones
Idioma del documento
Idioma de Tesseract para mejorar el reconocimiento


Separador

Saltos de línea

Puede tardar varios minutos · resultado en ZIP