PDF Escaneado a CSV
Para PDFs que son imágenes (documentos físicos escaneados). Usa Apache Tika + Tesseract OCR para reconocer tablas aunque no haya texto incrustado.
Haz clic o arrastra un PDF escaneado aquí
Máximo 1 GB · PDFs con imágenes (escaneados)
Máximo 1 GB · PDFs con imágenes (escaneados)
Subiendo...
Estado del servicio OCR
Verificando servicio Apache Tika...
Verificando...
El OCR puede tardar varios minutos para PDFs con muchas páginas.
Procesando OCR
Utiliza Apache Tika (apache/tika:latest-full) con Tesseract OCR para leer PDFs escaneados.
Para PDFs con texto real incrustado, usar PDF a CSV (más rápido).
Los CSV resultantes usan utf-8-bom, compatible con Excel.
⚠ El procesamiento OCR puede tardar entre 1 y 10 minutos según el tamaño del PDF. No cerrar la pestaña durante el proceso.