Guten Mittag,
ich spiele gerade etwas mit OCRs rum. Ich möchte nur Zahlen einlesen. tesseract liefert die bisher das beste Ergebnis. Nun habe ich aber das Problem das eine 7 teilweiße als v erkannt (ja ich frage mich auch warum). Meine Überlegen war das ich nur Zahlen zulasse. Hier bin ich fündig geworden.http://code.google.com/p/tesseract-ocr/wiki/FAQ
Das Problem ist wenn ich
1 | tesseract /home/fettpet/Bilder/Captcha/113767.bmp /home/fettpet/ausg nobatch digits |
aufrufe kriege ich die Fehlermeldung
read_variables_file:Can't open /usr/share/tesseract-ocr/tessdata/configs/digitsTesseract Open Source OCR Engine
ich habe dann mal das hier ausprobiert
1 | tesseract /home/fettpet/Bilder/Captcha/113767.bmp /home/fettpet/ausg /usr/share/tesseract-ocr/tessdata/configs/digitsTesseract |
da kriege ich folgende Fehlermeldung.
error: Could not find variable 'tessedit_char_whitelist'
Die Datei tessdata/configs/digits existiert.
Hat jemand eine Idee was ich machen muss, damit es funktioniert?
mfg Fettpet
2004 – 2013 ubuntuusers.de • Einige Rechte vorbehalten