Chemnitzsurfer schrieb:
Denke das Problem ist, das fast alles was mit PDF unter linux zu tun hat auf ghostscript als Unterbau setzt und damit die gleichen Kompressionenmechanismen nutzt.
Also existieren die Biblioteken dazu gar nicht. Ob da jetzt PDF, Tiff, png oder sonst was rein kommt ist mir im Prinzip egal. Die frage ist nur, ob ein Tool existiert, dass den Algorithmus drin hat. Ich weiß nicht, ob da pero openCV irgendwas geht oder andere Libs da Funktionalitäten haben.
Und Pattermatching ist auch mit Vorsicht zu genießen, da gab es vor ein paar Jahren in Xerox Kopieren einen Bug der Zahlen vertauscht hat . Gibt dazu auch einen CCC Talk vom Entdecker David Kriesel "Traue keinen Scan, den du nicht selbst gefälscht hast"
Ja den Talk kenne ich der ist Klasse. Der Bug betrifft aber die jeweiligen Xerox-Kopierer und nicht den Algorithmus als ganzen.
ChickenLipsRfun2eat
Es gibt alternativ auch noch https://poppler.freedesktop.org, zum Beispiel in Verwendung mit qpdf. Ob der deine Wünsche erfüllen kann, weiß ich aber nicht.
Die Libs kannte ich noch nicht da schaue gerne mal rein
Ich nutze meist pdflatex oder xetex, da ich als Ausgangsdateien an sich nur welche vom Emacs org-mode (der nach Tex exportieren kann) oder echte latex-Dateien habe.
Latex benutze ich auch das ist super, nur ist das schwer anwendbar, wenn ich Dateien, die in irgendeiner Form Bilder sind vorliegen habe und die dann kleindampfen muss