Saltar al contenido principal
Volver al blog
7 min de lectura

Cómo aplicar OCR a un PDF escaneado gratis — Sin subirlo a ningún sitio

Escaneas un contrato, lo guardas como PDF e intentas copiar un párrafo — solo para descubrir que todo el documento es una imagen plana. El texto está ahí, visualmente, pero no puedes seleccionarlo, buscarlo ni copiarlo. Ahí es donde entra el OCR (Reconocimiento Óptico de Caracteres).

Esta guía te explica cómo aplicar OCR a un PDF escaneado o una imagen gratis, qué hace que un escaneo funcione bien o mal, y las trampas de privacidad a tener en cuenta con las herramientas online más populares.

Qué hace realmente el OCR

El OCR es una técnica que mira una imagen de texto y deduce las letras y palabras reales. La salida son datos de texto reales que puedes:

  • Copiar y pegar en cualquier lado
  • Buscar dentro de Word, Google Docs o tu sistema de archivos
  • Pasar a ChatGPT, Claude o cualquier otra herramienta de IA
  • Traducir con DeepL o Google Translate
  • Indexar para búsqueda de texto completo en todo tu archivo

Hasta que el OCR se ejecuta sobre un PDF escaneado, el documento es básicamente una foto. Después del OCR, es un documento de texto real.

Dos tipos de salida de OCR

Hay dos salidas útiles que verás:

  1. Texto plano (.txt) — Solo las palabras reconocidas, sin formato. Genial para pasar a otras herramientas.
  2. PDF buscable — La imagen original de la página se conserva exactamente, pero se añade una capa de texto invisible detrás. El PDF se ve idéntico al escaneo, pero ahora puedes seleccionar, copiar y buscar el texto. Esto es lo que quieres si necesitas que el documento se vea igual pero sea buscable.

Una buena herramienta de OCR te ofrece ambas opciones.

La trampa de privacidad del OCR online

La mayoría de las herramientas "gratuitas" de OCR online funcionan subiendo tu archivo a su servidor, ejecutando el OCR allí y devolviéndote el resultado. Eso está bien para un meme, pero es un problema para:

  • Declaraciones de impuestos
  • Historiales médicos
  • Contratos con cláusulas confidenciales
  • Documentos de identidad (pasaporte, DNI, carnet de conducir)
  • Extractos bancarios
  • Cualquier cosa cubierta por un acuerdo de confidencialidad

No tienes forma de verificar qué hacen con el archivo después de procesarlo. Muchos lo guardan indefinidamente, entrenan modelos con él o venden versiones anonimizadas. Lee con cuidado la política de privacidad de cualquier herramienta gratuita antes de subir escaneos sensibles.

La alternativa basada en navegador

Los navegadores modernos pueden ejecutar OCR localmente — sin necesidad de subir nada. El truco es Tesseract.js, un motor de OCR de código abierto que se compila a WebAssembly. La primera vez que lo usas para un idioma dado, tu navegador descarga un modelo de idioma pequeño (~10 MB). Después de eso, el OCR se ejecuta enteramente en tu máquina, sin necesidad de conexión.

Ese es el enfoque que usamos en la herramienta de OCR para PDF e imagen. Suelta un PDF escaneado o una imagen, elige el idioma y el texto reconocido aparece en el navegador. Nada sale de tu computadora.

Si tu entrada habitual es más bien una foto del móvil, una captura de pantalla o una sola imagen en lugar de un PDF de varias páginas, el Conversor de imagen a texto es el mismo motor con un enfoque pensado para ese caso de uso — mismo modelo de privacidad, misma precisión, solo una interfaz adaptada a fotos y capturas.

Paso a paso: OCR a un PDF escaneado en tu navegador

### 1. Abre la herramienta de OCR

Ve a yourpdftools.com/ocr. Es una sola página. Sin registro, sin correo, sin tarjeta.

### 2. Sube tu archivo

Puedes soltar:

  • Un PDF escaneado (de una o varias páginas)
  • Una imagen — PNG, JPG, WebP o BMP
  • Archivos de hasta 50 MB

Si tu archivo es grande o tiene muchas páginas, la herramienta procesa una página a la vez para que la interfaz siga respondiendo.

### 3. Elige el idioma

Este paso importa más de lo que parece. Tesseract es un motor multilingüe, pero solo puede reconocer bien un idioma a la vez. Si seleccionas inglés en un documento alemán, obtendrás texto incomprensible. La herramienta incluye 14 idiomas comunes: inglés, español, francés, alemán, portugués, italiano, neerlandés, ruso, árabe, hindi, japonés, coreano y chino (simplificado y tradicional).

Para documentos con varios idiomas, ejecuta el OCR una vez por idioma y combina los resultados.

### 4. Ejecuta el OCR

Haz clic en Ejecutar OCR. La primera vez que usas un idioma, el navegador descarga un modelo de idioma de ~10 MB. Se almacena en caché, así que las ejecuciones siguientes en el mismo idioma son instantáneas. Después, cada página se renderiza en un canvas y se reconoce.

Verás progreso en vivo por página: renderizando → reconociendo.

### 5. Usa la salida

Cuando el OCR termina, tienes tres cosas que puedes hacer:

  • Copiar el texto al portapapeles con un clic
  • Descargar .txt para guardar el texto plano
  • Descargar PDF buscable — esta es la opción mágica: un PDF nuevo que se ve idéntico a tu escaneo pero con una capa de texto invisible añadida. Ábrelo en cualquier lector de PDF (Vista Previa, Adobe, Chrome) y podrás seleccionar, buscar y copiar el texto.

Se muestra la puntuación de confianza del OCR para que sepas qué tan fiable es el reconocimiento. Por encima del 90% suele estar limpio. Por debajo del 70% significa que el escaneo de origen es de muy baja calidad para un OCR fiable — prueba a reescanear con un DPI mayor.

Qué hace que el OCR sea preciso (o no)

La calidad del OCR está casi enteramente determinada por el escaneo de origen. La herramienta solo puede trabajar con lo que le des. Sigue estas reglas:

  • 300 DPI es el punto óptimo. La mayoría de los escáneres usan 200 DPI por defecto, lo cual está bien para archivar pero es justo para OCR. Pon el escáner a 300 DPI para mejores resultados.
  • El texto en negro sobre fondo blanco funciona mejor. Los fondos de color, el texto de bajo contraste y los resaltados extraños reducen la precisión.
  • Páginas rectas, sin inclinación. Una página inclinada incluso 5 grados puede confundir al detector de líneas. La mayoría de los escáneres corrigen la inclinación; si el tuyo no lo hace, pasa la página por un filtro de enderezado primero.
  • Fuentes estándar. Times New Roman, Arial y Helvetica se reconocen casi a la perfección. Las fuentes decorativas o manuscritas costarán más.
  • Evita los diseños a dos columnas cuando sea posible. El motor de OCR lee de arriba a abajo; las columnas pueden mezclarse a menos que el diseño sea muy limpio.
  • Más resolución gana a menos compresión. Un JPEG de alta resolución con compresión suave es mejor que un PNG de baja resolución.

¿Y la escritura a mano?

Tesseract está entrenado principalmente con texto impreso. Leerá escritura a mano, pero la precisión cae al 50–70% incluso con caligrafía limpia. Para letra de imprenta cuidada es usable; para cursiva, prepárate para retipear gran parte. El OCR especializado en escritura a mano (como Google Cloud Vision) es notablemente mejor pero requiere subir a un servidor.

Casos de uso comunes

Algunos escenarios reales en los que esto es útil:

  • Recibos y facturas. Saca una foto, pásale OCR, pega los números en tu hoja de cálculo.
  • Archivos PDF antiguos. Una carpeta de documentos escaneados de hace años se vuelve totalmente buscable en tu sistema de archivos al convertirla a PDF buscables.
  • Libros y artículos. Un artículo de revista escaneado que quieres resaltar o citar.
  • Notas de reuniones. Foto de una pizarra o cuaderno, convertida a texto editable.
  • Extracción de datos de DNI o formularios. Escanea un formulario, pásale OCR, y mete el texto en una hoja de cálculo para entrada de datos — sin teclear.

Combinar OCR con otras herramientas

Una vez que tienes texto buscable, puedes pasarlo por el resto del kit:

  • Usa Extraer páginas para sacar solo las páginas que necesitas antes de aplicar OCR — ahorra tiempo en PDF largos
  • Usa PDF a texto sobre el PDF buscable resultante para obtener el texto plano por separado
  • Usa Comprimir PDF para reducir el PDF buscable y enviarlo por correo
  • Usa Proteger PDF para proteger con contraseña los escaneos sensibles antes de compartir

Resumen sobre privacidad

El OCR basado en navegador tiene una gran ventaja que vale la pena repetir: tu archivo nunca sale de tu computadora. No hay subida, no hay procesamiento en servidor, ni copia almacenada en ningún sitio. Puedes pasar OCR a una declaración de impuestos escaneada, un historial médico o un contrato laboral sin confiar en nadie más que en tu propio navegador. Para cualquier cosa sensible, esa es la única opción aceptable.

¿Listo para probarlo? Abre la herramienta de OCR y suelta un PDF escaneado o una foto. El primer modelo de idioma tarda unos segundos en cargar; después es instantáneo.

¿Trabajas con una sola foto o captura en lugar de un PDF? Usa el Conversor de imagen a texto — mismo motor, planteamiento más cercano, idéntica garantía de privacidad.