Hallo liebes Forum, ich stehe momentan vor einer großen Herausforderung: Die Digitalisierung alter Eingangsrechnungen (seufz).
Dafür scanne ich die Rechnungen, benenne sie in den Rechnungssteller und die Rechnungsnummer um und lade sie anschließend als PDF Datei in eine Cloud. Das ist mir jetzt aber nach einer 40 Stunden Woche nur scannen zu doof geworden und hoffe diesen Prozess automatisieren zu können.
Im Internet habe ich bereits nach einer Lösung gesucht und habe herausgefunden, dass ich mit Linux diesen Prozess automatisieren könnte. Ich habe jedoch leider keinerlei Programmiererfahrung und auch keine Erfahrung mit Linux.
Im Unternehmen habe ich einen Drucker von Canon mit Image Formula DR-S150 und mehrere tausende von Rechnungen.
Als Lösung habe ich gelesen, könnte ich ein OCR Tool, wie Tesseract nutzen, um z.B. die Rechnungsnummer und den Rechnungssteller auszulesen. Danach soll mir ein Programm dies als Name der PDF Datei ausgeben. Zuvor würde ich alle Rechnungen mit einer laufenden Nummer abspeichern, wobei es auch besser wäre, wenn ich einen Stapel Rechnungen einfach in den Scanner stecke und er automatishc erkennt, welche Seiten zusammengehören (Seitenzahl steht jedoch nicht immer an einer Stelle). Das Problem ist, dass das Feld mit der Rechnungsnummer nicht immer Rechnungsnummer heißt, sondern manchmal Belegnummer, Rechnungs-Nr., Re. Nr., Re. Nummer etc. heißen kann.
Ist es dennoch möglich dies zu automatisieren, oder bin ich damit auf dem Holzweg? Gibt es eventuell andere Lösungen?
Vielen Dank bereits im Voraus!
LG
Moderiert von sebix:
Thema in einen passenden Forenbereich verschoben. Bitte beachte die als wichtig markierten Themen („Welche Themen gehören hier her und welche nicht?“) in jedem Forenbereich. Danke.