frostschutz schrieb:
Du kannst mit ImageMagick, crop (schwarze Ränder abschneiden falls vorhanden) + threshold (Reduzierung auf Schwarz-Weiss) + histogram (quasi Pixelzählen) feststellen ob es mehr als nur ein paar Staubkörner gab...
Anderer Ansatz wäre statt blankem Trennblatt, solche Blätter mit QR-Code zu bedrucken und dann den QR-Code auszulesen. Dann könntest du auch Dokumente scannen, bei denen eine leere Seite auch mal gewollt ist.
Hey Das ist doch mal ne Klasse Idee, auf ImageMagic bin ich gar nicht gekommen. Ich hatte dies lediglich vor 15 Jahren mal benutzt um auf einem Server Bilder zu bearbeiten.
Auch das mit dem QR Code Trennblatt ist ne Klasse Idee, ich habe nämlich gerade ein wenig rumprobiert und die nächst zu nehmende Hürde wäre die Schwelle wann ist die Seite leer und wann nicht.
Ich scanne jetzt alle Dokumente (Vorder und Rückseite) als mehrseitiges TIF ein und ermittle den Anteil der beiden Werte mit:
| convert SCAN_0078.tif -define histogramm:unique-colors=true -format %c histogram:info: | sed -e 's/\([0-9]\+\).*/\1/'
|
Als Ergebnis Erhalte ich bei einer bedruckten Vorder- und leeren Rückseite:
115534 (Erste Seite schwarze Pixel)
3756194 (Erste Seite weiße Pixel
15 (Zweite Seite schwarze Pixel)
3871713 (Zweite Seite weiße Pixel)
Der Wert für die schwarzen Pixel variiert jedoch je nach Papier auf bis zu 400. Wobei hier die Gefahr besteht das etwas nicht korrekt erkannt wird wenn der Schwellenwert zu hoch gesetzt wird. Von daher wäre es besser mit einer QR Code Seite zu trennen.
Dann müsste ich aber wahrscheinlich die Seiten vorher auftrenne und einzeln durchlaufen.