Das mit dem umwandeln ist gar nicht so einfach, zuerst suche ich dos2unix und unix2dos von sysutils aber das gibt es wohl nicht mehr. flip mein die Datei wäre eine Binärdatei und ignoriert sie. Aber ich habe es geschafft mit dem Tool recode, das hier fand ich ganz nett:
JuergenF schrieb:
Als Bash-Alias gehts auch:
alias dos2unix='recode ibmpc..lat1'
alias unix2dos='recode lat1..ibmpc'
Jedenfalls sieht es nun so aus:
##Tabelle extrahieren
sed -n '/<table/,/\/table>/p' FILHP473.htm > FILHP473.htm_table
#In UNIX umwandeln
recode ibmpc..lat1 FILHP473.htm_table
#das ersten Span-Ende um ein NEUNL erweitern
sed -e "0,/<\/span>/s//<\/span>NEUNL/" FILHP473.htm_table > neu
#alle (Unix!)Zeilenumbrüche durch ALTNL ersetzen
sed ':a;N;$!ba;s/\n/ALTNL/g' FILHP473.htm_table > temp
#den gewünschten snap-Tag entfernen
sed -e "0,/<span.*\/span>/s///" temp > temp2
# "ALTNL" wieder in Zeilenumbrüche umwandeln
sed -e "s/ALTNL/\n/g" temp2 > FILHP473.htm_table
Werde ich natürlich noch optimieren, sed-Befehle verketten usw. aber es funktioniert.
Danke an alle !!!