Hallo,
ich habe ein PDF das sich täglich ändert. Mit dem Befehl
1 | pdftotext -layout -nopgbrk -enc 'UTF-8' ve.pdf ve |
wandle ich es in eine Textdatei um. Die Tabelle in der Textdatei sieht folgendermaßen aus:
Di, 30.09.14 TEXT TEXT TEXT TEXT TEXT TEXT TEXT TEXT Mi, 01.10.14 TEXT MUSTER TEXT TEXT TEXT MUSTER TEXT TEXT TEXT
Das heißt ich möchte alle Zeilen mit dem gesuchten Muster ausgeben und jedes gefundenes Datum (aber nicht die ganze Zeile, sondern nur Datums). Die ganzen Zeilen ausgeben habe ich schon geschafft:
1 | awk '$1~/(Mo|Di|Mi|Do|Fr){1}/ || /MUSTER/ {print $0}' ve |
Der Reguläre Ausdruck für die Datums ist /(Mo|Di|Mi|Do|Fr){1}, digit]{2}.digit]{2}.digit]{2}/, wie kann ich den Rest der Zeile abschneiden?
LG Jake