Hallo,
ich bein gerade in der Endphase meines Workflows zur Archivierung von Dokumenten.
Da ich kein Duplex Scanner habe bau ich mir die PDF's wieder mit pdftk zusammen. Mit Tesseract wir die OCR Durchsuchbarkeit des PDF's erstellt.
Da es immer wieder vorkommen kann, dass die letzte Seite eines mehrseitigen Dokumentes leer sein kann möchte ich das diese gelöscht wird.
Tesseract gibt beim bearbeiten der PDF folgende Meldung für die Datei mit der leeren Seite aus: INFO - 1: [tesseract] Empty page!!
Kann Tesseract in eine Logdatei die Seiten Zahl der leeren Seite schreiben?
Oder kennt jemand ein Programm das leere Seiten über Kommandozeile erkennen und löschen kann?
Gruß
Thomas