Hallo,
da ich ein ähnliches Problem wie der Themenstarter Mojo_Dodo hatte, habe ich das Thema der Einfachheit halber wieder ausgegraben, um Euch meine Lösung zu präsentieren. Denn die hier in den bisherigen Beiträgen sowie in diesem Thema präsentierten Lösungen waren leider für mich alle nicht zielführend, so dass ich mich dann via Internet-Suchmaschine nach alternativen Lösungsmöglichkeiten umgesehen habe und auch viele einschlägige Treffer verbuchen konnte – auf die eigentliche Lösung bin ich jedoch erst gekommen, als ich nach langer Suche einen eigenen Einfall zu einer der angebotenen Lösungen bekam.
Denn meiner eingescannte PDF-Datei Image006.pdf fehlt, wie sich im Laufe meiner Recherche und der Reparaturversuche herausgestellt hat, anscheinend der "startxref"-Abschnitt, und der "xref"-Abschnitt ist kaputt. Dies zumindest gibt (im Terminal und im selben Arbeitsverzeichnis wie die beschädigte PDF-Datei) der mutool
-Befehl zum Reparieren aus (zunächst kommt allerdings die Installation des benötigten Paketes mupdf-tools; → MuPDF (Abschnitt „Weitere-Werkzeuge“)):
| sudo apt-get install mupdf-tools
mutool clean Image006.pdf
|
Ausgabe:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19 | error: cannot find startxref
warning: trying to repair broken xref
warning: line feed missing after stream begin marker (6 0 R)
warning: line feed missing after stream begin marker (5 0 R)
warning: line feed missing after stream begin marker (12 0 R)
warning: line feed missing after stream begin marker (11 0 R)
warning: line feed missing after stream begin marker (18 0 R)
warning: line feed missing after stream begin marker (17 0 R)
warning: line feed missing after stream begin marker (24 0 R)
warning: line feed missing after stream begin marker (23 0 R)
warning: line feed missing after stream begin marker (30 0 R)
warning: line feed missing after stream begin marker (29 0 R)
warning: line feed missing after stream begin marker (36 0 R)
warning: line feed missing after stream begin marker (35 0 R)
warning: line feed missing after stream begin marker (42 0 R)
warning: line feed missing after stream begin marker (41 0 R)
warning: line feed missing after stream begin marker (48 0 R)
warning: line feed missing after stream begin marker (47 0 R)
Speicherzugriffsfehler
|
Auf diesen Lösungsversuch (sowie übrigens auch auf einige andere sinnvolle) bin ich übrigens durch diese I-Seite 🇩🇪 gekommen.
Schlussendlich bestand meine Lösung jedoch nicht darin, mein PDF versuchen zu reparieren (was mir ja auch nicht gelang), sondern darin, dessen Inhalte (also in meinem Fall lediglich PNG-Bilder) zu extrahieren und sie danach (wieder) zu einer neuen PDF-Datei zusammenzufügen!
Dass man zum Extrahieren auch einfach den mutool
-Befehl verwenden kann, darauf musste ich (so wie bereits erwähnt) allerdings erst selber kommen, denn in keiner meiner Internet-Fundstellen wurde darauf explizit hingewiesen:
| mutool extract Image006.pdf
|
Ausgabe:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26 | error: cannot find startxref
warning: trying to repair broken xref
warning: line feed missing after stream begin marker (6 0 R)
warning: line feed missing after stream begin marker (5 0 R)
warning: line feed missing after stream begin marker (12 0 R)
warning: line feed missing after stream begin marker (11 0 R)
warning: line feed missing after stream begin marker (18 0 R)
warning: line feed missing after stream begin marker (17 0 R)
warning: line feed missing after stream begin marker (24 0 R)
warning: line feed missing after stream begin marker (23 0 R)
warning: line feed missing after stream begin marker (30 0 R)
warning: line feed missing after stream begin marker (29 0 R)
warning: line feed missing after stream begin marker (36 0 R)
warning: line feed missing after stream begin marker (35 0 R)
warning: line feed missing after stream begin marker (42 0 R)
warning: line feed missing after stream begin marker (41 0 R)
warning: line feed missing after stream begin marker (48 0 R)
warning: line feed missing after stream begin marker (47 0 R)
extracting image img-0005.png
extracting image img-0011.png
extracting image img-0017.png
extracting image img-0023.png
extracting image img-0029.png
extracting image img-0035.png
extracting image img-0041.png
extracting image img-0047.png
|
Die Bilder landeten übrigens im selben Verzeichnis wie die beschädigte PDF-Datei. Wie bereits gesagt, wurden die extrahierten Bilder danach (mittels convert
aus ImageMagick (Abschnitt „convert“)) zu einer neuen PDF-Datei zusammengefügt:
Der Vollständigkeit halber möchte ich nachfolgend noch weitere I-net-Quellen erwähnen, wovon ich allerdings nur die Lösungsvorschläge der ersten fast vollständig probiert habe und von der zweiten nur origami:
Weitere mögliche alternative PDF-Toolos zum umwandeln und extrahieren:
Zum Bilder-zusammenfügen empfehle ich die folgenden Themen: