PDF Escaneado a CSV — PDF Export

Opciones

Idioma del documento

Idioma de Tesseract para mejorar el reconocimiento

Unificar tablas iguales Si varias tablas tienen las mismas columnas, unirlas en un solo CSV

Separador

Saltos de línea

Puede tardar varios minutos · resultado en ZIP

🔍

Haz clic o arrastra un PDF escaneado aquí
Máximo 1 GB · PDFs con imágenes (escaneados)

Subiendo...

PDF

Estado del servicio OCR

Verificando servicio Apache Tika...

Procesando OCR

Iniciando... 0%

Utiliza Apache Tika (apache/tika:latest-full) con Tesseract OCR para leer PDFs escaneados.

Para PDFs con texto real incrustado, usar PDF a CSV (más rápido).

Los CSV resultantes usan utf-8-bom, compatible con Excel.

⚠ El procesamiento OCR puede tardar entre 1 y 10 minutos según el tamaño del PDF. No cerrar la pestaña durante el proceso.