Sortierprogramm/Duplikatfinder

« Vorherige 1 23Nächste »

Status: Ungelöst | Ubuntu-Version: Nicht spezifiziert
Antworten |

user_unknown

Anmeldungsdatum:
10. August 2005

Beiträge: 17552

Wohnort: Berlin

Zitieren

20. September 2017 03:29 (zuletzt bearbeitet: 20. September 2017 03:31)

Ich fand ja rklms Ansatz am besten.

Und besser finde ich auch, den Dateinamen beim Start zu übergeben:

#!/bin/bash
#
datei=$1
#
select auswahl in name ip domaene ABBRUCH
do
	case $auswahl in 
		name)		spalte=1; break;; 
		ip) 		spalte=2; break;; 
		domaene) 	spalte=3; break;; 
		ABBRUCH) 	exit 1;	  break;;
		*) echo fail Auswahl nicht angeboten;; 
	esac
done 

doppelte=($(sed -r 's/[ \t]+/;/g;s/.de~+/.de/' $datei | tr A-Z a-z | cut -d\; -f $spalte | sort | uniq -d))
for muster in ${doppelte[@]}
do
	grep -i $muster $datei
done

Der Selectblock ermittelt die Spaltennummer.

sed -r 's/[ \t]+/;/g; geht von ein oder mehreren Tabs oder Blanks als Spaltentrenner aus. Da ist vielleicht noch Handarbeit nötig. Es war nicht ganz durchsichtig, was da jetzt wirklich benutzt wird.

Die Tilden werden nur bei de~~ entfernt, bei .com, .org, .net usw. müsste man das ändern.

Tr ist das translatecommando, dass aus youTUBE youtube macht, aber radikal aus einer Domäne 00-CA-FE-CA-FE-00 auch 00-ca-fe-ca-fe-00 machen würde.

Cut schneidet dann die gewählte Spalte aus.

Sort/uniq -d wählen nur die verbliebenen doppelten aus. Der Output des Kommandos x wird mit $(x) in ein Array gesteckt durch runde Klammern: doppelte=($(x)).

Mit der For-Schleife greppen wir nach den Elementen des Arrays, -i um insensitiv gegenüber Groß-/Kleinschreibung zu sein (youTUBE).

Vorprogrammierte Fehler: Ein Name bar.de, der doppelt ist, triggert auch foobar.de. Das ist aber leicht zu heilen.

Marc_BlackJack_Rintsch Team-Icon

Ehemalige

Anmeldungsdatum:
16. Juni 2006

Beiträge: 4578

Wohnort: Berlin

Zitieren

20. September 2017 10:42

Hat sich jetzt das hier beschriebene gewünschte Ergebnis/Ausgabeformat geändert?

Pifler

(Themenstarter)

Anmeldungsdatum:
6. September 2017

Beiträge: 16

Zitieren

20. September 2017 16:45

@user_unknown Vielen Dank! @track Die Internetseite bezüglich Regex hat mir sehr geholfen! Danke! @Marc_BlackJack_Rintsch Ja das Ausgabeformat stimmt fast genau so!

Aktuell habe ich eine folgende Ausgabe wenn ich nach IP´s filtere:

192.168.2.5
     www.youtube.de x 192.168.2.5 x 00-80-41-ae-fg-2e
     www.hi.de x 192.168.2.5 x 00-80-41-ae-lk-7e

Jetzt wäre es jedoch sinnvoll, dass ich der ersten Spalte eine feste Länge von circa 40 zuweise, der zweiten Spalte dann immer von 15 usw. gewünschte Ausgabe wäre dann:

192.168.2.5
     www.youtube.de                         x 192.168.2.5  x 00-80-41-ae-fg-2e
     www.hi.de                              x 192.168.2.5  x 00-80-41-ae-lk-7e

Damit nun alle Felder schön untereinander stehen.

Mein Plan war es, da das Programm ja funktioniert nur eine Zeile abzuändern:

hilf= "\n  " $1 " x " $3 " x " $4 " x " $5 " x " $12

hilf=$(printf ( "%-40sx", $1 )| printf ( "%-15sx", $2 )|printf ( "%-17sx", $3 )|printf ( "%-21sx", $4 )|printf ( "%-21sx", $5 )|printf ( $6 ))

Das das Schreiben in die Variable funktioniert noch nicht so ganz .... ;(

Hier nochmal mein bereits funktionierendes Script! Es geht mir lediglich nur um die Formatierung. Darauf liegt auch mein Augenmerk aktuell. Mein aktueller Code

#!/bin/bash
#Eingabe des Benutzers
read -p "Bitte Übergeben Sie eine Datei aus Kaspersky Security Center (CSV)?" "inputdatei" 
echo "Name IP-Adresse Windows Domäne Datenbakversion Einschaltzeit ..."
# Header werden weggeschnitten
cat "$inputdatei"|
tr '\t' '#' |
awk -F# '{print $1 " x " $2 " x " $3 " x " $4 " x " $5 " x " $12}' > sortierung.txt 
sed -ie '/Name/d' sortierung.txt 
#Abschneiden der Tilden und Zahlen 
sed -r -ie 's/.de~++[0-9]+/.de/;s/.de~+/.de/' sortierung.txt 
echo "Es stehen folgende Spalten zur Verfügung: "
echo "Name =1, IP-Adresse=2, Windows-Domäne=3"
read -p "Bitte geben Sie die gewünschte Suchspalte an " spalte awk -Fx '
    { # Fuer jede Eingabelinie 
      # wird eine Ausgabelinie für die IP der aktuellen Eingabelinie

      hilf=$(printf ( "%-40sx", $1 )| printf ( "%-15sx", $2 )|printf ( "%-17sx", $3 )|printf ( "%-21sx", $4 )|printf ( "%-21sx", $5 )|printf ( $6 ))
     # Inkrementierung des Zaehlers fuer den aktuelle Suchwert
      ++count[$'$spalte']
      # Erstellt einen kombinierten Ausgabetext für alle Vorkommnisse der IP/MAC/Name 
      # Verwendung eines assoziativen Arrays 
      text[$'$spalte'] = text[$'$spalte'] hilf } END { # Nachdem die gesamte Datei eingelesen wurde
      print "\n Name    x       IP-Adresse      x       Windows-Domäne  x       Datenbankversion        x       Einzeitschalt   x       Gruppe"
        for (i in count) {
        # Fuer jede IP-/MAC-Ausgabe, falls mehrere Vorhanden sind
        if ( count[i] > 1 )
        printf "\n%s%s\n", i, text[i]
      }
}
' sortierung.txt

rm sortierung.txt

Vielen Dank!

rklm Team-Icon

Projektleitung

Anmeldungsdatum:
16. Oktober 2011

Beiträge: 12829

Zitieren

20. September 2017 18:10

Wenn Du schon eine temporäre Datei im Dateisystem nutzt, solltest Du folgendes tun:

Sicherstellen, dass der Name nicht kollidieren kann
Sicherstellen, dass die Datei abgeräumt wird, wenn das Skript fertig ist.

Also:

#!/bin/bash

# working file
tmpfile=$(mktemp)

# make sure file is removed at exit
trap "rm -f '$tmpfile'" 0

#Eingabe des Benutzers
read -p "Bitte Übergeben Sie eine Datei aus Kaspersky Security Center (CSV)?" "inputdatei" 
echo "Name IP-Adresse Windows Domäne Datenbakversion Einschaltzeit ..."
# Header werden weggeschnitten
cat "$inputdatei"|
tr '\t' '#' |
awk -F# '{print $1 " x " $2 " x " $3 " x " $4 " x " $5 " x " $12}' > "$tmpfile"
...

track

Anmeldungsdatum:
26. Juni 2008

Beiträge: 7174

Wohnort: Wolfen (S-A)

Zitieren

20. September 2017 19:10

Vom Prinzip her würde ich solche sachen, die nur für die Bildschirm-Ausgabe gebraucht werden, auch tatsächlich nur für bei der Bildschirmausgabe machen. (also nicht schon beim Speichern in den Variablen)

Übrigens kann printf mehrere Daten in einem Rutsch ausgeben: ^{(guck Dir mal die Doku von man printf an ! )}

track@track:~$ feld=( www.youtube.de  192.168.2.5  00-80-41-ae-fg-2e )
track@track:~$ printf "    %-40s%-16s%s\n"  ${feld[0]}  ${feld[1]}  ${feld[2]}
    www.youtube.de                          192.168.2.5     00-80-41-ae-fg-2e

Was hältst Du von der Variante, das Feld mit der variablen Länge einfach ans Ende der Zeile zu setzten ? - das sieht nicht ganz so zerrissen aus:

track@track:~$ printf "    %-16s%-20s%s\n" ${feld[1]} ${feld[2]} ${feld[0]}
    192.168.2.5     00-80-41-ae-fg-2e   www.youtube.de

Und wenn Du unbedingt die Zeile in einer Variablen speichern willst, geht das natürlich auch:

track@track:~$ zeile=$( printf "    %-16s%-20s%s\n" ${feld[1]} ${feld[2]} ${feld[0]} )
track@track:~$ echo "$zeile"
    192.168.2.5     00-80-41-ae-fg-2e   www.youtube.de

LG,

track

Pifler

(Themenstarter)

Anmeldungsdatum:
6. September 2017

Beiträge: 16

Zitieren

21. September 2017 09:54

Vielen Dank! track rklm

Denkt Ihr, dass das so funktioniert? Kann es leider heute nicht ausprobieren... Werde es morgen testen!

#!/bin/bash
#Eingabe des Benutzers
read -p "Bitte Übergeben Sie eine Datei aus Kaspersky Security Center (CSV)?" "inputdatei" 
echo "Name IP-Adresse Windows Domäne Datenbakversion Einschaltzeit ..."
# Header werden weggeschnitten
cat "$inputdatei"|
tr '\t' '#' |
awk -F# '{print $1 " x " $2 " x " $3 " x " $4 " x " $5 " x " $12}' > sortierung.txt 
sed -ie '/Name/d' sortierung.txt 
#Abschneiden der Tilden und Zahlen 
sed -r -ie 's/.de~++[0-9]+/.de/;s/.de~+/.de/' sortierung.txt 
echo "Es stehen folgende Spalten zur Verfügung: "
echo "Name =1, IP-Adresse=2, Windows-Domäne=3"
read -p "Bitte geben Sie die gewünschte Suchspalte an " spalte awk -Fx '
    { # Fuer jede Eingabelinie 
      # wird eine Ausgabelinie für die IP der aktuellen Eingabelinie

      #hilf=$(printf ( "%-40sx", $1 )| printf ( "%-15sx", $2 )|printf ( "%-17sx", $3 )|printf ( "%-21sx", $4 )|printf ( "%-21sx", 
      # $5 )|printf ( $6 ))
      # hilf= "\n  " $1 " x " $3 " x " $4 " x " $5 " x " $12  --> eigentliche Zeile ohne feste Spaltenlänge
      hilf=$( printf "    %-16s%-20s%s\n" ${feld[1]} ${feld[2]} ${feld[0]} )
     # Inkrementierung des Zaehlers fuer den aktuelle Suchwert
      ++count[$'$spalte']
      # Erstellt einen kombinierten Ausgabetext für alle Vorkommnisse der IP/MAC/Name 
      # Verwendung eines assoziativen Arrays 
      text[$'$spalte'] = text[$'$spalte'] hilf } END { # Nachdem die gesamte Datei eingelesen wurde
      print "\n Name    x       IP-Adresse      x       Windows-Domäne  x       Datenbankversion        x       Einzeitschalt   x       Gruppe"
        for (i in count) {
        # Fuer jede IP-/MAC-Ausgabe, falls mehrere Vorhanden sind
        if ( count[i] > 1 )
        printf "\n%s%s\n", i, text[i]
      }
}
' sortierung.txt

rm sortierung.txt

Das von rklm baue ich morgen direkt in den Code ein!.

« Vorherige 1 23Nächste »

Antworten |

« Vorheriges Thema Nächstes Thema »