ubuntuusers.de

OCR mit schön leserlicher Schrift

Status: Ungelöst | Ubuntu-Version: Ubuntu 22.04 (Jammy Jellyfish)
Antworten |

zappel

Anmeldungsdatum:
15. Januar 2024

Beiträge: 11

Hallo Gemeinde! Ich habe Bücher eingescannt (200 DPI, sw, PDF) und zum Zweck der Wortsuche mit dem Programm "ocrmypdf" bearbeitet. Das klappt auch soweit. Das Problem ist, dass die Buchstaben ziemlich ausgefranst sind und dadurch nicht besonders schön aussehen. Was muss ich tun um die Buchstaben nach schön leserlich im Format PDF (ohne Verlust von Absätzen, Formatierung usw.) zu konvertieren? (Zu meiner Verwunderung scheint ocrmypdf das überhaupt nicht zu können.)

redknight Team-Icon

Moderator & Supporter
Avatar von redknight

Anmeldungsdatum:
30. Oktober 2008

Beiträge: 21869

Wohnort: Lorchhausen im schönen Rheingau

Mein Paperless verwendet ocrmypdf und ich kenne das Problem nicht - allerdings scanne ich wie in den docs empfohlen mit 300 dpi.

Ich finde gerade nicht, ob diese Empfehlung aus den docs von Paperless oder ocrmypdf direkt stammt

sh4711

Anmeldungsdatum:
13. Februar 2011

Beiträge: 1253

zappel schrieb:

... Was muss ich tun ...

Mit einer besseren/höheren Auflösung scannen oder die Dateien aufarbeiten/vorbereiten.

sh4711

Anmeldungsdatum:
13. Februar 2011

Beiträge: 1253

Hier noch ein paar Tips bzw. eine Veranschaulichung von dpi Unterschieden.

Antworten |