Eingescanntes PDF kostenlos per OCR durchsuchbar machen — ohne Hochladen
Du scannst einen Vertrag, speicherst ihn als PDF und willst einen Absatz kopieren — nur um festzustellen, dass das ganze Dokument ein flaches Bild ist. Der Text ist visuell vorhanden, aber du kannst ihn nicht markieren, durchsuchen oder kopieren. Genau hier kommt OCR (Optical Character Recognition, optische Zeichenerkennung) ins Spiel.
Diese Anleitung erklärt, wie du ein eingescanntes PDF oder Bild kostenlos per OCR verarbeitest, was einen Scan gut oder schlecht macht und welche Datenschutz-Fallen bei den beliebten Online-Tools lauern.
Was OCR eigentlich macht
OCR ist eine Technik, die ein Bild von Text betrachtet und die tatsächlichen Buchstaben und Wörter erkennt. Die Ausgabe sind echte Textdaten, die du:
- überall hin kopieren und einfügen kannst
- in Word, Google Docs oder deinem Dateisystem durchsuchen kannst
- an ChatGPT, Claude oder jedes andere KI-Tool weitergeben kannst
- mit DeepL oder Google Translate übersetzen kannst
- für die Volltextsuche über dein gesamtes Archiv indexieren kannst
Bevor OCR über ein eingescanntes PDF läuft, ist das Dokument im Grunde ein Foto. Nach dem OCR ist es ein echtes Textdokument.
Zwei Arten von OCR-Ausgabe
Es gibt zwei nützliche Ausgaben:
- Klartext (.txt) — Nur die erkannten Wörter, keine Formatierung. Super, um sie an andere Tools weiterzugeben.
- Durchsuchbares PDF — Das Original-Seitenbild bleibt exakt erhalten, aber dahinter wird eine unsichtbare Textebene hinzugefügt. Das PDF sieht identisch zum Scan aus, aber du kannst den Text jetzt markieren, kopieren und durchsuchen. Das willst du, wenn das Dokument gleich aussehen, aber durchsuchbar sein soll.
Ein gutes OCR-Tool bietet beide Optionen.
Die Datenschutz-Falle bei Online-OCR
Die meisten „kostenlosen" Online-OCR-Tools funktionieren so: Datei wird auf den Server hochgeladen, dort wird OCR ausgeführt, das Ergebnis kommt zurück. Für ein Meme okay, aber problematisch bei:
- Steuererklärungen und Lohnsteuerbescheinigungen
- Krankenakten
- Verträgen mit vertraulichen Klauseln
- Ausweisdokumenten (Reisepass, Führerschein)
- Kontoauszügen
- Allem, was unter eine NDA fällt
Du hast keine Möglichkeit, zu prüfen, was sie nach der Verarbeitung mit der Datei machen. Viele behalten sie unbegrenzt, trainieren Modelle damit oder verkaufen anonymisierte Versionen. Lies die Datenschutzerklärung jedes kostenlosen Tools sorgfältig, bevor du sensible Scans hochlädst.
Die browserbasierte Alternative
Moderne Browser können OCR lokal ausführen — kein Upload nötig. Der Trick ist Tesseract.js, eine Open-Source-OCR-Engine, die zu WebAssembly kompiliert wird. Beim ersten Mal pro Sprache lädt dein Browser ein kleines (~10 MB) Sprachmodell. Danach läuft das OCR komplett auf deinem Rechner — ohne Netzverbindung.
Das ist der Ansatz, den wir im Tool OCR für PDF & Bild verwenden. Scan-PDF oder Bild reinziehen, Sprache wählen, und der erkannte Text erscheint im Browser. Nichts verlässt deinen Computer.
Wenn deine Eingabe häufiger ein Handyfoto, Screenshot oder ein einzelnes Bild statt eines mehrseitigen PDFs ist, ist der Bild-zu-Text-Konverter dieselbe Engine mit einer auf diesen Anwendungsfall abgestimmten Aufmachung — gleiches Datenschutzmodell, gleiche Genauigkeit, einfach eine UI für Fotos und Screenshots.
Schritt für Schritt: OCR für ein eingescanntes PDF im Browser
### 1. OCR-Tool öffnen
Geh auf yourpdftools.com/ocr. Eine einzige Seite. Keine Anmeldung, keine E-Mail, keine Karte.
### 2. Datei hochladen
Du kannst Folgendes ablegen:
- Ein eingescanntes PDF (einzelne oder mehrere Seiten)
- Ein Bild — PNG, JPG, WebP oder BMP
- Dateien bis 50 MB
Bei großen Dateien oder vielen Seiten verarbeitet das Tool eine Seite nach der anderen, damit die UI reaktionsfähig bleibt.
### 3. Sprache wählen
Dieser Schritt ist wichtiger, als man denkt. Tesseract ist eine mehrsprachige Engine, kann aber nur eine Sprache pro Lauf gut erkennen. Wenn du Englisch für ein deutsches Dokument wählst, kommt Kauderwelsch raus. Das Tool bringt 14 gängige Sprachen mit: Englisch, Spanisch, Französisch, Deutsch, Portugiesisch, Italienisch, Niederländisch, Russisch, Arabisch, Hindi, Japanisch, Koreanisch und Chinesisch (vereinfacht und traditionell).
Bei mehrsprachigen Dokumenten lass OCR einmal pro Sprache laufen und kombiniere die Ergebnisse.
### 4. OCR ausführen
Klick auf OCR ausführen. Beim ersten Mal pro Sprache lädt der Browser ein ~10 MB großes Sprachmodell. Es wird gecacht, also sind weitere Läufe in derselben Sprache sofort. Danach wird jede Seite auf einen Canvas gerendert und erkannt.
Du siehst Live-Fortschritt pro Seite: Rendern → Erkennen.
### 5. Das Ergebnis nutzen
Wenn das OCR fertig ist, hast du drei Optionen:
- Kopieren — Text mit einem Klick in die Zwischenablage
- Als .txt herunterladen — Klartext speichern
- Als durchsuchbares PDF herunterladen — die magische Option: ein brandneues PDF, das identisch zu deinem Scan aussieht, aber mit einer unsichtbaren Textebene. In jedem PDF-Reader (Vorschau, Adobe, Chrome) kannst du den Text markieren, durchsuchen und kopieren.
Der OCR-Konfidenzwert wird angezeigt, damit du weißt, wie zuverlässig die Erkennung ist. Über 90 % ist meist sauber. Unter 70 % heißt: der Quell-Scan ist zu schlecht für zuverlässiges OCR — versuch's mit höherem DPI neu zu scannen.
Was OCR genau (oder ungenau) macht
Die OCR-Qualität hängt fast vollständig vom Quell-Scan ab. Das Tool kann nur mit dem arbeiten, was du ihm gibst. Halte dich an diese Regeln:
- 300 DPI ist der Sweetspot. Die meisten Scanner stehen standardmäßig auf 200 DPI, was zum Archivieren reicht, aber für OCR grenzwertig ist. Stell den Scanner für beste Ergebnisse auf 300 DPI.
- Schwarzer Text auf weißem Hintergrund funktioniert am besten. Farbige Hintergründe, kontrastarmer Text und seltsame Hervorhebungen verschlechtern die Genauigkeit.
- Gerade, entzerrte Seiten. Eine um nur 5 Grad gekippte Seite kann den Zeilen-Detektor verwirren. Die meisten Scanner entzerren automatisch; falls deiner nicht, jag die Seite vorher durch einen Entzerrungs-Filter.
- Standard-Schriften. Times New Roman, Arial und Helvetica werden fast perfekt erkannt. Dekorative oder handschriftliche Schriften machen Probleme.
- Zwei-Spalten-Layouts möglichst vermeiden. Die OCR-Engine liest von oben nach unten; Spalten können sich vermischen, wenn das Layout nicht sehr sauber ist.
- Höhere Auflösung schlägt schwächere Kompression. Ein hochauflösendes JPEG mit milder Kompression ist besser als ein niedrig aufgelöstes PNG.
Handschrift?
Tesseract ist hauptsächlich auf gedruckten Text trainiert. Es liest Handschrift, aber die Genauigkeit fällt selbst bei sauberer Handschrift auf 50–70 %. Für ordentliche Druckschrift brauchbar; bei Schreibschrift musst du große Teile abtippen. Spezialisierte Handschrift-OCR (wie Google Cloud Vision) ist deutlich besser, erfordert aber den Upload an einen Server.
Häufige Anwendungsfälle
Ein paar reale Szenarien, wo das nützlich ist:
- Belege und Rechnungen. Foto machen, OCR drüberlaufen lassen, Zahlen in die Tabelle einfügen.
- Alte PDF-Archive. Ein Ordner mit eingescannten Dokumenten von vor Jahren wird im Dateisystem voll durchsuchbar, sobald er als durchsuchbare PDFs vorliegt.
- Bücher und Artikel. Ein eingescannter Zeitschriftenartikel, den du markieren oder zitieren willst.
- Notizen aus Meetings. Foto eines Whiteboards oder Notizbuchs, in editierbaren Text umgewandelt.
- Daten aus Ausweisen und Formularen. Formular scannen, OCR drüberlaufen lassen, Text in eine Tabelle für die Dateneingabe geben — ohne zu tippen.
OCR mit anderen Tools kombinieren
Sobald du durchsuchbaren Text hast, kannst du ihn durch den Rest des Werkzeugkastens schicken:
- Nutz Seiten extrahieren, um vor dem OCR nur die nötigen Seiten zu ziehen — spart Zeit bei großen PDFs
- Nutz PDF zu Text auf das resultierende durchsuchbare PDF, um den Klartext separat herauszuholen
- Nutz PDF komprimieren, um das durchsuchbare PDF für den E-Mail-Versand zu verkleinern
- Nutz PDF schützen, um sensible Scans vor dem Teilen mit einem Passwort zu sichern
Datenschutz-Zusammenfassung
Das browserbasierte OCR hat einen großen Vorteil, der eine Wiederholung wert ist: deine Datei verlässt nie deinen Computer. Kein Upload, keine Server-Verarbeitung, keine Kopie irgendwo gespeichert. Du kannst eine eingescannte Steuererklärung, eine Krankenakte oder einen Arbeitsvertrag per OCR verarbeiten, ohne irgendwem außer deinem eigenen Browser zu vertrauen. Für alles Sensible ist das die einzig akzeptable Wahl.
Lust, es auszuprobieren? Öffne das OCR-Tool und leg ein eingescanntes PDF oder Foto rein. Das erste Sprachmodell braucht ein paar Sekunden zum Laden; danach ist es sofort.
Arbeitest du stattdessen mit einem einzelnen Foto oder Screenshot? Nutz den Bild-zu-Text-Konverter — gleiche Engine, einfacher formuliert, identische Datenschutzgarantie.