pdfsandwich › Rund ums Wiki › Aktiv werden › Forum › ubuntuusers.de

pdfsandwich

« Vorherige12 Nächste »

Status: Gelöst | Ubuntu-Version: Nicht spezifiziert
Antworten |

Dieses Thema ist die Diskussion des Artikels pdfsandwich.

Heinrich_Schwietering Wikiteam Anmeldungsdatum: 12. November 2005 Beiträge: 11290 Wohnort: Bremen	Zitieren 11. August 2010 14:33 Hi! Kleiner Artikel zu pdfsandwich, was mir gerade über den Weg gelaufen war. Cuneiform wird immer besser, die Ergebnisse find ich ziemlich beeindruckend, erstaunlicherweise mit pdfsandwich wesentlich besser als mit dem neusten gscan2pdf-Version, die den selben OCR-Engine verwenden kann... Warum die Konvertierung in das bmp3-Format nötig ist, ist mir nicht ganz klar, cuneiform sollte, zumindest wenn mit imagmagick gebaut, auch so mit mehrseitigen PDF-Dateien klarkommen. Vielleicht klappt die Umwandlung in die OCR-PDF damit nicht? Werde den Autor des Programms eh' noch mal anschreiben, ob das ganze für ihn so OK ist. Ansonsten: Anmerkungen, Wünsche, Korrekturen etc. pp. immer willlkommen! so long hank
pippovic Anmeldungsdatum: 12. November 2004 Beiträge: 9130	Zitieren 11. August 2010 16:49 (zuletzt bearbeitet: 11. August 2010 16:49) Hallo, bist an zwei Stellen mit den Links auf den Wissensblock durcheinander gekommen, aber ansonsten alles knorke. Verwendet das Programm wirklich als Logo das Bild eines McRib? Gruß pippovic
Heinrich_Schwietering Wikiteam (Themenstarter) Anmeldungsdatum: 12. November 2005 Beiträge: 11290 Wohnort: Bremen	Zitieren 11. August 2010 18:59 Hi! pippovic schrieb: bist an zwei Stellen mit den Links auf den Wissensblock durcheinander gekommen, aber ansonsten alles knorke. Na, da muss ich dann wohl noch mal nacharbeiten 😉 Verwendet das Programm wirklich als Logo das Bild eines McRib? Da verrät sich der McKenner 😀 ... Ja, es ist auf der Seite tatsächlich als Logo abgebildet 🤣 (muss aber noch einen Rechte-Link anbringen, hab' ich gerade festgestellt). Der Entwickler hat sich auch gerade auf meine E-Mail gemeldet, auch von dort keine "Beschwerden"; die Konvertierung mit convert nach bmp3 ist deswegen drin, weil wohl viele ältere Cuneiform-Versionen, die noch so im Umlauf sind, tatsächlich nur bmp3 können... so long hank
Heinrich_Schwietering Wikiteam (Themenstarter) Anmeldungsdatum: 12. November 2005 Beiträge: 11290 Wohnort: Bremen	Zitieren 18. August 2010 10:30 Hi! Geht das jetzt mit dem Link zur Bildquelle so? Bin mir nicht ganz sicher, ob das so reicht, sonst müsste ich vielleicht noch was als Fußnote einfügen. so long hank
noisefloor Ehemaliger Anmeldungsdatum: 6. Juni 2006 Beiträge: 29065 Wohnort: WW	Zitieren 18. August 2010 12:53 Hallo, IMHO ist die Einleitung etwas verwirrend. Weil: grundsätzlich sind PDFs durchsuchbar. Es geht doch darum, gescannte PDFs durchsuchbar zu machen, oder? Das kann man sich zwar am Ende zusammen reimen, aber so richtig explizit kommt das nicht raus. Gruß, noisefloor
Heinrich_Schwietering Wikiteam (Themenstarter) Anmeldungsdatum: 12. November 2005 Beiträge: 11290 Wohnort: Bremen	Zitieren 18. August 2010 13:28 Hi! Ja, da bin ich gerade zu sehr im Thema 😉 (das hatten wir schon mal, (bei der pdfocr-Seite glaube ich). Mach ich klarer so long hank
Heinrich_Schwietering Wikiteam (Themenstarter) Anmeldungsdatum: 12. November 2005 Beiträge: 11290 Wohnort: Bremen	Zitieren 18. August 2010 14:57 (zuletzt bearbeitet: 18. August 2010 16:56) Hi! So besser? Außerdem hab' ich noch das Problem mit den Cuneiform-Versionen und hocr2pdf (hoffentlich) etwas deutlicher gemacht. Eigentlich sollten die auf der Downloadseite bereitgestellten Pakete schon nur Cuneiform <0.9.0 zulassen, da gab's aber einen bug, den der Entwickler jetzt in der svn-Version schon behoben hat, aber die Pakete sind noch nicht aktualisiert. Sonst wär' ich wohl soweit durch... so long hank
noisefloor Ehemaliger Anmeldungsdatum: 6. Juni 2006 Beiträge: 29065 Wohnort: WW	Zitieren 18. August 2010 16:45 Hallo, besser. Gruß, noisefloor
march Anmeldungsdatum: 12. Juni 2005 Beiträge: 17337 Wohnort: /home/noise	Zitieren 18. August 2010 17:23 Würde noch bei bmp3 und hOCR eine Link zur Wikipedia setzen wo das genau erklärt wird. Ansonsten IMHO OK.
Heinrich_Schwietering Wikiteam (Themenstarter) Anmeldungsdatum: 12. November 2005 Beiträge: 11290 Wohnort: Bremen	Zitieren 18. August 2010 20:41 (zuletzt bearbeitet: 18. August 2010 20:41) Hi! Ja, guter Hinweis - erledigt... so long hank
Heinrich_Schwietering Wikiteam (Themenstarter) Anmeldungsdatum: 12. November 2005 Beiträge: 11290 Wohnort: Bremen	Zitieren 22. August 2010 10:06 Hi! Jetzt im Wiki: pdfsandwich. so long hank
hagan Anmeldungsdatum: 11. März 2009 Beiträge: Zähle...	Zitieren 7. Januar 2011 20:12 Probleme¶ Wenn bei der Erstellung unerwartet große PDF-Dateien entstehen (ein Vielfaches der Ausgangsdokumentgröße), kann es helfen, die entstandenen Dateien > erneut mit pdfsandwich zu bearbeiten. Damit sollte die Größe auf ein normales Maß zurückgeführt werden können. Weiss man woher dieses Problem kommt? Bei mir tritt das immer auf. Ist auch etwas störend wenn man viele scans in einem Rutsch konvertieren will. Gruß Marcus
Heinrich_Schwietering Wikiteam (Themenstarter) Anmeldungsdatum: 12. November 2005 Beiträge: 11290 Wohnort: Bremen	Zitieren 7. Januar 2011 21:00 Hi! Ich zumindest weiß leider nicht, woher es kommt - was für PDF-Vorlagen nimmst du, wie hast du sie erstellt? so long hank
hagan Anmeldungsdatum: 11. März 2009 Beiträge: 3	Zitieren 7. Januar 2011 21:51 Bei mir sind das gescannte Dokumente. Scanned by Simple-Scan. Ich muss mal mit den Einstellungen rumspielen. Hatte gehofft, jemand hat schon eine Lösung gefunden ☺ Gruß Marcus
Heinrich_Schwietering Wikiteam (Themenstarter) Anmeldungsdatum: 12. November 2005 Beiträge: 11290 Wohnort: Bremen	Zitieren 7. Januar 2011 22:50 Hi! Ich würde dir gscan2pdf empfehlen, mit ocropus als engine, da hast du gute Ergebnisse, kein Probleme mit "fehlgrößen" bei den Texten, und alles in einem Aufwasch (musst allerdings eine aktuelle Version nehmen...) so long hank

« Vorherige12 Nächste »

Antworten |

« Vorheriges Thema Nächstes Thema »