Aufgrund meiner persönlichen Erfahrungen gehe ich bei der Archivierung (oder eher dem Wegwerfen der Originale) so vor, dass alles ohne Unterschrift, Siegel (vor allem gestempelte oder geklebte) oder ausgeklügelte Papiersorten auch digitalisiert in Ordnung ist und das Original weg kann. [...]
Alles, was eine wichtige Unterschrift, Siegel etc. hat, würde ich wohl auch nur in Graustufen scannen. Damit sieht es dann wirklich wie eine Kopie aus (was es ja ist) und ich werde hoffentlich nicht der Fälschung bezichtigt. Immerhin handelt es sich in diesen Fällen um eine Sicherungskopie, falls das analoge Original verloren geht. Ob man mit der Kopie dann tatsächlich Sachen beantragen oder belegen kann, wird sich dann zeigen (aber hoffentlich auch nie notwendig sein). Aber es dürfte besser sein, als nichts zu haben.
Ich hebe generell alle derartigen Dokumente eine Weile lang auf. Mit digitalen Kopien würde ich aber z.B. die von dir genannten "eher unwichtigen" Dokumente deutlich schneller entsorgen. Teilweise vermutlich sogar direkt nach dem Einscannen und Backup machen.
Dokumente, die eher nur einen gewissen Informationsgehalt haben, aber nicht eingereicht oder aufbewahrt werden müssen, reichen vermutlich auch in 300-600 DPI und s/w (oder niedrigen Auflösung und Graustufen).
Auch würde ich NICHT in PDF scannen, sondern eben in lossless Bilder mindestens mit 250 px/cm, da die meisten meisten Normalodrucke mit 118 px/cm gemacht werden. Je mehr, desto besser, vor allem wenn Bilder drin vorkommen und je wichtiger das Dokument wird.
Du meinst also mind. 600 dpi? Aus welchen Gründen meinst du, sollte man nicht in eine PDF scannen?
Dann wäre Texterkennung überlegenswerter (ggf. auch später aus einer gescannten Bilddatei heraus).
Aktuell wäre mir das Einarbeiten in OCR und der ganze Aufwand (es muss ja alles zur Kontrolle gelesen werden) zu viel im Vergleich zum Nutzen. Die meisten Dokumente, die man so einscannt, sind ja eh nur wenige Seiten. Da finde ich dann hoffentlich schon schnell, was ich suche. Wenn man das auch nachträglich aus einer Bilddatei oder PDF machen kann, kann ich das ja immer noch machen, wenn ich es merke, ich brauche das.
Erst, wenn auch die Form oder gar das Aussehen des Papiers wirkliche Bedeutung hat, kann man dann alles als Bild abspeichern.
Ja, ich denke, das ist bei den meisten Dokumenten schon wichtig. Dokumente von Versicherungen, Abrechnungen etc. vom Layout her zu verfälschen, würde Dinge wohl eher komplizierter machen.
Ich bin mir sicher, dass es Scanner gibt, die über den ADF brauchbare Ergebnisse erzielen. Im bezahlbaren Bereich für Privatanwender ist mir allerdings noch keiner untergekommen. [...]
Was kostet denn ein Scanner mit brauchbaren ADF? Und was für Probleme kennst du so mit ADFs beim Scannen?
Ich habe aktuell einen Brother DCP-9045CDN Farblaser, der gerade beim Drucken aber viele Probleme macht. Evtl. tausche ich den in den nächsten 1-2 Jahren mal gegen einen s/w Multi (mit Duplexdruck und ADF) aus, vielleicht wieder von Brother. Denn wenn er unter Linux druckt, druckt er mit schönerem Schriftbild als unter Windows 😀.
Nein, XSane wird ebenfalls Rohdaten erzeugen und die dann erst beim Speichern in das entsprechende Format pressen. PNM ist nur ein weiteres Rastergrafikformat.
Ah, ok. Ich hatte das überlegt, weil bei "Multi Page PDF" erst .pnm Dateien erzeugt werden, wenn ich mich jetzt nicht irre.
Ganz so kurz wie dein Befehl wird es mit Ghostscript nicht, aber man könnte das einfach in ein Script packen und damit zugänglicher machen. Wie weit das verlustlos bleibt, ist einfach nur abhängig von den Einstellungen. Es ist aber bspw. kein Problem nachträglich eine PDF mit eingebetteten Rastergrafiken in eine PDF/A zu konvertieren, ohne dabei die Rastergrafiken oder deren Kompression zu verändern.
Ok, das schaue ich mir dann etwas später an und frage ggf. nochmal nach, falls ich Probleme damit habe.
Die Frage stellt sich eigentlich eher anders herum, welchen Vorteil hat man, wenn man Rastergrafiken in einseitige PDFs einbettet und nicht in einem Rastergrafikformat speichert? [...]
Ok, es kommt also häufiger die Empfehlung, zumindest längere Dokumente oder das Buch als Rastergrafik zu speichern und dann zu konvertieren. Welches Dateiformat wäre denn hier angebracht? Und wie eignet sich das zur Langzeitarchivierung?
Gründe für PDF waren für mich bisher das, was schon an anderen Stellen hier erwähnt worden ist: Universell überall zu öffnen, Langzeitarchivierung, einfaches Drucken.
Das ist stark von der Implementierung abhängig. Ein (für diesen Anwendungsfall) richtig gutes Programm lässt PDF-Dateien in der Größe deiner Festplatte zu, weil es immer nur die paar Seiten durch den Speicher schleust, die du gerade im Bild hast bzw. gerade eben durchgeblätter hast.
Ich nutze unter Linux eigentlich immer Okular. Unter Windows, sofern ich das mal nutze, Sumatra PDF. Für Formulare in PDFs auch schon mal das von Adobe.
PDF unterstützt auch verlustfreie Verfahren zur Einbettung von Grafiken. Ob convert hierfür Optionen bietet, müsstest du in dessen Dokumentation nachschlagen.
Es gibt ja scheinbar den compress
Befehl bei convert
. Ich hätte jetzt vermutet, dass dies die erwähnte lossless Komprimierung von Grafiken beim Umwandeln in PDF betrifft.
Wir haben die Verwirrung noch gar nicht perfekt gemacht und darauf hingewiesen, dass es zu PDF/A noch ein Alternative names DjVu gibt.
Hehe, ja. Allerdings dachte ich, dass DjVu nicht so geläufig und daher weniger Unterstützung anbietet als PDF. Daher im Sinne der Langzeitarchivierung war der Gedanke eben bei PDF.
Worauf ich hinaus will: Wenn man konsequent digital arbeitet gewinnt eine ausgeklügelte Speicher- und Backupstrategie enorm an Bedeutung.
Ich habe ebenfalls kein NAS. Ich habe nicht genügend Geräte (eigentlich nur 1), das Zugriff auf die Daten braucht. Einen gesicherten Zugriff über das Internet einzurichten, traue ich mir nicht ganz zu. Ich könnte zwar ein gutes Tutorial befolgen, würde aber in diesem Fall gerne mehr von den Hintergründen verstehen und wäre auch nicht in der Lage, nachher zu überprüfen, alles richtig gemacht zu haben. Das ist mir aktuell zu unsicher. Aber mal gucken, wer weiß, was noch so kommt. 😉
Ich habe 2 interne Festplatten und ich spiegele mittels rsync
alles manuell auf die 2. Festplatte (Schutz gegen Ausfall der 1.). Dann habe ich noch eine kleine 2.5" externe Festplatte, auf der ich dann ein richtiges Backup mache. Ich möchte auch "demnächst" eine externe Festplatte für außer-Haus-Backups einrichten. Und sofern ich nicht anfange, meine DVDs und BluRays digital zu sichern (falls überhaupt möglich), reicht mir der Speicherplatz auch noch eine Weile.
Die digitale Ordnerstruktur wird wohl erstmal die analoge Ordnerstruktur übernehmen. Dateien bezeichne ich in der Regel im Format YYYY-MM-DD_Titel des Dokuments
.