ubuntuusers.de

PDF Problematik

Status: Ungelöst | Ubuntu-Version: Server 20.04 (Focal Fossa)
Antworten |

Panzli

Anmeldungsdatum:
17. Dezember 2021

Beiträge: Zähle...

Hallo, ich habe ein Script entworfen, welches mir aus einem heruntergeladenen PDF Dokument (wird zu einer txt konvertiert und dann wird mit cat und grep nur ein bestimmter Teil der PDF in eine neue txt Datei geschrieben ) diese wird dann zu einem jpg Bild umgewandelt und mir per Email geschickt.

Nun hätte ich jedoch gerne eine bessere Lösung, wo die in der PDF vorhandene Tabelle wenn möglich nicht großartig umformatiert wird.

Ein weiteres Problem ist, dass sich der PDF Inhalt immer ändern...

Danke schonmal im voraus

pastone

Anmeldungsdatum:
15. Juli 2010

Beiträge: 184

Vorschlag: Das umzuformende Dokument mit dem Programm Bildschirmfoto abfotografieren - es gibt im Softwarecenter eine Auswahl. Die Datei passend in Writer einfügen und als pdf-Datei ausdrucken oder konvertieren. Fertig.

Panzli

(Themenstarter)

Anmeldungsdatum:
17. Dezember 2021

Beiträge: Zähle...

Danke, dass ist aber keine Lösung die ich anstrebe, da ich schonmal keine Grafikoberfläche habe und ich mich nicht 3 mal am Tag hinstellen möchte um Screenshots zu machen...

MisterIgo

Anmeldungsdatum:
23. April 2009

Beiträge: 947

ImageMagick kann auf der Kommandozeile PDFs in JPGs umwandeln (das Programm heißt convert). Du musst ihm nur den richtigen Ausschnitt mitteilen, dann bleibt die ganze Formatierung erhalten.

seahawk1986

Anmeldungsdatum:
27. Oktober 2006

Beiträge: 11248

Wohnort: München

Je nachdem wie die Tabelle aufgebaut ist, lohnt sich ggf. ein Blick auf tabulapdf/tabula - das lässt sich wie in https://asciinema.org/a/22761 gezeigt auch als CLI-Programm nutzen. Aus den CSV-Daten kann man dann eine hübsch formatierte Tabelle rekonstruieren (z.B. mit Hilfe von LaTeX oder Reportlab oder über den Umweg einer Auszeichnungssprache wie Markdown und Pandoc: baig/pandoc-csv2table) und die als PDF oder Bild ausgeben.

rklm Team-Icon

Projektleitung

Anmeldungsdatum:
16. Oktober 2011

Beiträge: 13174

Panzli schrieb:

Hallo, ich habe ein Script entworfen, welches mir aus einem heruntergeladenen PDF Dokument (wird zu einer txt konvertiert und dann wird mit cat und grep nur ein bestimmter Teil der PDF in eine neue txt Datei geschrieben ) diese wird dann zu einem jpg Bild umgewandelt und mir per Email geschickt.

Nun hätte ich jedoch gerne eine bessere Lösung, wo die in der PDF vorhandene Tabelle wenn möglich nicht großartig umformatiert wird.

Was genau ist denn überhaupt das Ziel der Übung? Kannst Du eine Beispieleingabe und -ausgabe teilen?

Ein weiteres Problem ist, dass sich der PDF Inhalt immer ändern...

Ändern sich nur die Daten oder auch die Struktur. Falls letzteres wird es vermutlich schwierig, eine automatisierte Lösung zu finden.

Antworten |