Hallo,
ich suche einen Import-Filter für Libreoffice für *.ps Dateien, der die Druckersteuerzeichen entfernt und die Datei in ein verwendbares Dokument umwandelt. Habe nichts gefunden - habe ich Tomaten auf den Augen?
TausB
![]() Anmeldungsdatum: Beiträge: 1570 Wohnort: Terra incognita |
Hallo, ich suche einen Import-Filter für Libreoffice für *.ps Dateien, der die Druckersteuerzeichen entfernt und die Datei in ein verwendbares Dokument umwandelt. Habe nichts gefunden - habe ich Tomaten auf den Augen? TausB |
![]() Anmeldungsdatum: Beiträge: 5523 Wohnort: south central EL |
Ich glaube nicht, dass es dafür überhaupt einen Import-Filter gibt. Inkscape kann PostScript evtl. als Pfade importieren, und man könnte es anschließend als SVG für die Weiterverwendung in LO speichern - oder auch gleich als PDF. Man kann mit ps2eps auch die PostScript in eine Encapsuled PostScript konvertieren, die dann zwar beim Einbetten in LO immer noch nicht richtig dargestellt wird, aber der Weg über Inkscape wäre wieder möglich, falls es kein PS importieren kann. Optional bietet ghostscript diverse Befehlszeilenwerkzeuge um PostScript in irgendwas anderes zu konvertieren. Damit könnte man das als PDF rendern lassen und anschließend den PDF-Import in LO versuchen. Ich muss an dieser Stelle zugeben, dass mir dein Anwendungsfall nicht vollständig klar ist. Versuchst du Text aus einer PostScript-Datei in LibreOffice Writer verfügbar zu machen, oder eine Grafik zu importieren? Ich verstehe den Ausdruck „verwendbares Dokument“ in diesem Zusammenhang nicht eindeutig. |
(Themenstarter)
![]() Anmeldungsdatum: Beiträge: 1570 Wohnort: Terra incognita |
Hmmm ...
ja
nein
Da war ich wohl nicht konkret genug 😬 : Text. Import über eine *.ps Datei war nur eine Alternative zum Testen. Meine erste Wahl *.pdf werden in LibreOffice nach "Draw" importiert und jede Zeile steht in einer eigenen Textbox - das ist Mist. Gibt es einen besseren Weg ein *.pdf Dokument zu importieren oder konvertieren? So daß zumindest Absätze erhalten bleiben und in Writer der Text "vernünftig" bearbeitbar ist? Hinweis: Der Text im *.pdf ist selbst keine Grafik sondern als Text enthalten - ich brauche also kein OCR-Programm. TausB |
![]() Anmeldungsdatum: Beiträge: 5523 Wohnort: south central EL |
Also es gibt für PS wie PDF die Möglichkeit den Text zu extrahieren. Zum Einen kann man dafür Befehlszeilenwerkzeuge verwenden um den Text aus einer solchen Datei in eine Textdatei schreiben zu lassen - optional mit Mark-Up für HTML oder als Abiword-Datei ( Zum Anderen kann man auch einfach die PS oder PDF im Dokumentenbetrachter öffnen und den gesamten Text markieren, kopieren und in das gewünschte Dokument einfügen. Ob das funktioniert hängt mitunter vom Dokumentenbetrachter ab. Prinzipiell hängt die Möglichkeit Text aus einer PS/PDF zu extrahieren in jedem Fall davon ab, ob es überhaupt Textobjekte in der Datei gibt, oder ob es sich lediglich um Pfade handelt. In deinem Fall sollte das aber kein Problem sein. Darüber hinaus könntest du noch die Import-Filter verschiedener Programme testen. Je nach Anwendungsfall bzw. Input-Datei kann man neben Libre/OpenOffice verschiedene Ergebnisse beim Import in Inkscape, Scribus oder Abiword erzielen. Bei PS/PDF handelt es sich in beiden Fällen um ein Endformat, das für die Veröffentlichung und nicht die Weiterverarbeitung vorgesehen ist. Das macht diesen Anwendungsfall so kompliziert und unzuverlässlich in den Ergebnissen. |
(Themenstarter)
![]() Anmeldungsdatum: Beiträge: 1570 Wohnort: Terra incognita |
Hallo mrkramps, danke für Deine Ausführungen.
... sagt im Prinzip alles. O.K. - es war naiv zu glauben, daß Formatierungen wie Farben und Absätze erhalten bleiben würden 😬 . Der Text ist mit einfachem copy-&-paste zu erfassen. Da dieses Problem nur selten bei mir auftaucht, werde ich den Thread schließen. TausB |