ubuntuusers.de

XSane Texterkennung gibt Unsinn aus

Status: Gelöst | Ubuntu-Version: Ubuntu 12.04 (Precise Pangolin)
Antworten |

temrix

Anmeldungsdatum:
30. Januar 2014

Beiträge: 102

Hallo! Ich habe "XSane" installiert und danach "GOCR". Wenn ich nun etwas scanne und dann in eine Textdatei ausgeben will mit "GOCR" kommt dabei nur wirrer Text raus. Also nicht einfach wirre Wörter, sondern kompletter Blödsinn. Meine Frage ist nun, wie man "GOCR" lauffähig bringt oder ob und wie man das bessere "tesseract" einbinden kann.

Danke schonmal im Voraus!

MPW

Anmeldungsdatum:
4. Januar 2009

Beiträge: 3731

Hallo,

ich kann dir gscan2pdf empfehlen, dass ist ein grafisches Frontend für Digitalisierungsaufgaben und kann mit allen drei großen Texterkennungen umgehen (tesseract,cuneiform, gocr). Die ersten beiden sind meiner Einschätzung nach bedeutend besser als gocr.

Trotzdem kannst du damit nicht Qualitäten wie bei Google Books erwarten. Das was mit Open Source möglich ist, ist lediglich ein PDF/Bild mit Test zu hinterlegen, sodass es durchsuchbar wird.

Grüße MPW

Wohnmobil

Anmeldungsdatum:
24. Februar 2008

Beiträge: 486

Wohnort: Nickenich

Hallo temrix

Ich kann die YAGF empfehlen. Die Texterkennung ist um Längen besser als bei gocr.

temrix

(Themenstarter)

Anmeldungsdatum:
30. Januar 2014

Beiträge: 102

Habe jetzt einmal G2PDF installiert. Habe auch die seite um 90° gedreht, jedoch gibt GOCR immer noch komplett sinnloses raus, während tesseract und cuneiform überhaupt nichts ausgeben.

napo22

Anmeldungsdatum:
2. Juli 2011

Beiträge: 146

Der Grund warum ich noch immer XP nutze ist dass es unter Linux keine Texterkennung gibt die Omnipage gleich kommt.

temrix

(Themenstarter)

Anmeldungsdatum:
30. Januar 2014

Beiträge: 102

Habe gerade noch von meinem Drucker eine Version von OmniPage gefunden. Funktioniert das nur auf XP oder auch auf Windows 7? Wenn ich es unter Linux nicht hinbekomme, müsste ich es halt unter XP versuchen mit OmniPage.

MPW

Anmeldungsdatum:
4. Januar 2009

Beiträge: 3731

Hast du die erforderlichen Pakete denn installiert?

temrix

(Themenstarter)

Anmeldungsdatum:
30. Januar 2014

Beiträge: 102

Habe alles installiert. Wenn du willst schau ich nochmal nach. Das mit OmniPage kann ich übrigens vergessen, das gibt mir nur ein Bild statt des Textes aus...

temrix

(Themenstarter)

Anmeldungsdatum:
30. Januar 2014

Beiträge: 102

Wenn ich das Bild unter Windows scanne und dann von g2pdf importieren lasse, bekomme ich etwas Sinnvolles heraus. Muss also irgendwas am Scan haben.

temrix

(Themenstarter)

Anmeldungsdatum:
30. Januar 2014

Beiträge: 102

Ich hab tatsächlich die falsche Scangröße eingestellt, das Bild war sogar ein bisschen unscharf. Danke für die Antworten!

Antworten |