Hallo zusammen,
ich habe eine recht große Datenmenge (> 500 GB), welche ich über Kommandozeilen-Tools auslesen möchte. Da ich mich bislang nie mit Parallelisierung oder Performance von Shell-Kommandos auseinandersetzen musste, die folgenden beiden Fragen:
Ist die Parallelisierung mit xargs so korrekt?
Gibt es aus eurer Sicht sonst noch Evaluierungsbedarf was die Performance angeht?
1 | time find . -name "*.txt" | perl -pe 's/\n/\0/' | xargs -0 grep -i -e 'Wert 1' -e 'Wert 2' -e 'Wert 3' > /mnt/hgfs/ergebnisse/1st.txt |
Gruß jaik