Hallo,
ich habe nach der Anleitung im Wiki tesseract-ocr xsane2tess eingerichtet. Leider kann tesseract die Bilddateien anscheinend nicht lesen. In der Log-Datei ist folgendes vermerkt:
Tesseract Open Source OCR Engine name_to_image_type:Error:Unrecognized image type:/home/alex/tmp/xsane-conversion-hpaio:_usb_Officejet__Pro__8500__A909a_serial=MY96K430MF.tif.tiff IMAGE::read_header:Error:Can't read this image type:/home/alex/tmp/xsane-conversion-hpaio:_usb_Officejet__Pro__8500__A909a_serial=MY96K430MF.tif.tiff tesseract:Error:Read of file failed:/home/alex/tmp/xsane-conversion-hpaio:_usb_Officejet__Pro__8500__A909a_serial=MY96K430MF.tif.tiff /usr/local/bin/xsane2tess: Zeile 78: 8788 Segmentation fault tesseract "$TIF_FILE".tiff "$TXT_FILE" -l "$TES_LANG" 1>&2 cat: /home/alex/tmp/xsane-conversion-hpaio:_usb_Officejet__Pro__8500__A909a_serial=MY96K430MF.txt: No such file or directory rm: Entfernen von „/home/alex/tmp/xsane-conversion-hpaio:_usb_Officejet__Pro__8500__A909a_serial=MY96K430MF.tif“ nicht möglich: No such file or directory
Ich kann die Bilder manuell mit Gimp umwandeln und dann mit tesseract lesen lassen. Es wäre aber schön, wenn es auch direkt gehen würde. Hat jemand eine Idee? Vielleicht ein Fehler im Scipt?