Heinrich_Schwietering
Wikiteam
Anmeldungsdatum: 12. November 2005
Beiträge: 11290
Wohnort: Bremen
|
Hi! Kleiner Artikel zu pdfsandwich, was mir gerade über den Weg gelaufen war. Cuneiform wird immer besser, die Ergebnisse find ich ziemlich beeindruckend, erstaunlicherweise mit pdfsandwich wesentlich besser als mit dem neusten gscan2pdf-Version, die den selben OCR-Engine verwenden kann... Warum die Konvertierung in das bmp3-Format nötig ist, ist mir nicht ganz klar, cuneiform sollte, zumindest wenn mit imagmagick gebaut, auch so mit mehrseitigen PDF-Dateien klarkommen. Vielleicht klappt die Umwandlung in die OCR-PDF damit nicht? Werde den Autor des Programms eh' noch mal anschreiben, ob das ganze für ihn so OK ist. Ansonsten: Anmerkungen, Wünsche, Korrekturen etc. pp. immer willlkommen! so long hank
|
pippovic
Anmeldungsdatum: 12. November 2004
Beiträge: 9130
|
Hallo, bist an zwei Stellen mit den Links auf den Wissensblock durcheinander gekommen, aber ansonsten alles knorke. Verwendet das Programm wirklich als Logo das Bild eines McRib? Gruß
pippovic
|
Heinrich_Schwietering
Wikiteam
(Themenstarter)
Anmeldungsdatum: 12. November 2005
Beiträge: 11290
Wohnort: Bremen
|
Hi! pippovic schrieb:
bist an zwei Stellen mit den Links auf den Wissensblock durcheinander gekommen, aber ansonsten alles knorke.
Na, da muss ich dann wohl noch mal nacharbeiten 😉 Verwendet das Programm wirklich als Logo das Bild eines McRib?
Da verrät sich der McKenner 😀 ... Ja, es ist auf der Seite tatsächlich als Logo abgebildet 🤣 (muss aber noch einen Rechte-Link anbringen, hab' ich gerade festgestellt). Der Entwickler hat sich auch gerade auf meine E-Mail gemeldet, auch von dort keine "Beschwerden"; die Konvertierung mit convert nach bmp3 ist deswegen drin, weil wohl viele ältere Cuneiform-Versionen, die noch so im Umlauf sind, tatsächlich nur bmp3 können... so long hank
|
Heinrich_Schwietering
Wikiteam
(Themenstarter)
Anmeldungsdatum: 12. November 2005
Beiträge: 11290
Wohnort: Bremen
|
Hi! Geht das jetzt mit dem Link zur Bildquelle so? Bin mir nicht ganz sicher, ob das so reicht, sonst müsste ich vielleicht noch was als Fußnote einfügen. so long hank
|
noisefloor
Ehemaliger
Anmeldungsdatum: 6. Juni 2006
Beiträge: 29065
Wohnort: WW
|
Hallo, IMHO ist die Einleitung etwas verwirrend. Weil: grundsätzlich sind PDFs durchsuchbar. Es geht doch darum, gescannte PDFs durchsuchbar zu machen, oder? Das kann man sich zwar am Ende zusammen reimen, aber so richtig explizit kommt das nicht raus. Gruß, noisefloor
|
Heinrich_Schwietering
Wikiteam
(Themenstarter)
Anmeldungsdatum: 12. November 2005
Beiträge: 11290
Wohnort: Bremen
|
Hi! Ja, da bin ich gerade zu sehr im Thema 😉 (das hatten wir schon mal, (bei der pdfocr-Seite glaube ich). Mach ich klarer so long hank
|
Heinrich_Schwietering
Wikiteam
(Themenstarter)
Anmeldungsdatum: 12. November 2005
Beiträge: 11290
Wohnort: Bremen
|
Hi! So besser? Außerdem hab' ich noch das Problem mit den Cuneiform-Versionen und hocr2pdf (hoffentlich) etwas deutlicher gemacht. Eigentlich sollten die auf der Downloadseite bereitgestellten Pakete schon nur Cuneiform <0.9.0 zulassen, da gab's aber einen bug, den der Entwickler jetzt in der svn-Version schon behoben hat, aber die Pakete sind noch nicht aktualisiert. Sonst wär' ich wohl soweit durch... so long hank
|
noisefloor
Ehemaliger
Anmeldungsdatum: 6. Juni 2006
Beiträge: 29065
Wohnort: WW
|
Hallo, besser. Gruß, noisefloor
|
march
Anmeldungsdatum: 12. Juni 2005
Beiträge: 17337
Wohnort: /home/noise
|
Würde noch bei bmp3 und hOCR eine Link zur Wikipedia setzen wo das genau erklärt wird. Ansonsten IMHO OK.
|
Heinrich_Schwietering
Wikiteam
(Themenstarter)
Anmeldungsdatum: 12. November 2005
Beiträge: 11290
Wohnort: Bremen
|
Hi! Ja, guter Hinweis - erledigt... so long hank
|
Heinrich_Schwietering
Wikiteam
(Themenstarter)
Anmeldungsdatum: 12. November 2005
Beiträge: 11290
Wohnort: Bremen
|
Hi! Jetzt im Wiki: pdfsandwich. so long hank
|
hagan
Anmeldungsdatum: 11. März 2009
Beiträge: Zähle...
|
Probleme¶ Wenn bei der Erstellung unerwartet große PDF-Dateien entstehen (ein Vielfaches der Ausgangsdokumentgröße), kann es helfen, die entstandenen Dateien > erneut mit pdfsandwich zu bearbeiten. Damit sollte die Größe auf ein normales Maß zurückgeführt werden können.
Weiss man woher dieses Problem kommt? Bei mir tritt das immer auf. Ist auch etwas störend wenn man viele scans in einem Rutsch konvertieren will. Gruß
Marcus
|
Heinrich_Schwietering
Wikiteam
(Themenstarter)
Anmeldungsdatum: 12. November 2005
Beiträge: 11290
Wohnort: Bremen
|
Hi! Ich zumindest weiß leider nicht, woher es kommt - was für PDF-Vorlagen nimmst du, wie hast du sie erstellt? so long hank
|
hagan
Anmeldungsdatum: 11. März 2009
Beiträge: 3
|
Bei mir sind das gescannte Dokumente. Scanned by Simple-Scan. Ich muss mal mit den Einstellungen rumspielen. Hatte gehofft, jemand hat schon eine Lösung gefunden ☺ Gruß
Marcus
|
Heinrich_Schwietering
Wikiteam
(Themenstarter)
Anmeldungsdatum: 12. November 2005
Beiträge: 11290
Wohnort: Bremen
|
Hi! Ich würde dir gscan2pdf empfehlen, mit ocropus als engine, da hast du gute Ergebnisse, kein Probleme mit "fehlgrößen" bei den Texten, und alles in einem Aufwasch (musst allerdings eine aktuelle Version nehmen...) so long hank
|