Ich habe eine Wortliste und sortiere diese nach Häufigkeit mit dem folgenden Befehl:
cat wortliste.txt | sort -bfi -T "$(pwd)/" | uniq -c | sort -nr -T "$(pwd)/" > sort.txt
So weit, so gut. Es funktioniert perfekt und am Ende bekomme ich eine richtig sortierte Liste, die wie folgt aussieht:
1234459 der 1000528 die 389639 und 303958 aber 223474 ich 206320 du 197731 wir 191810 habe 187561 haben 86129 machen 75782 gehen 69567 sind 3637 Julia 3268 Franz 522 essen 136 Bursche 88 macht 79 Bande 67 Pistole 4 blabla 2 Russe 1 badboy
Nun ich habe ein Problem: sort fügt statt Nullen Leerzeichen am Anfang der Zeilen ein. Wie kann man diese durch 0 ersetzen? Die Liste soll danach so aussehen:
1234459 der 1000528 die 0389639 und 0303958 aber 0223474 ich 0206320 du 0197731 wir 0191810 habe 0187561 haben 0086129 machen 0075782 gehen 0069567 sind 0003637 Julia 0003268 Franz 0000522 essen 0000136 Bursche 0000088 macht 0000079 Bande 0000067 Pistole 0000004 blabla 0000002 Russe 0000001 badboy
Ich habe folgendes Befehl versucht:
cat test-sorting.txt | uniq -c | sort -n -r -T "$(pwd)/" | sed 's/ [ \t]*/0/' > test1.txt
Leider löscht er alle Leerzeichen außer einen, so dass man "01" anstatt "0000001" bekommt. Wie kann man das richtig machen?
PS:
sed 's/^\s*/0/' führte auch nicht zum Erfolg...
Grüße, Carsten
Bearbeitet von ChickenLipsRfun2eat:
Entspammt