Guten Morgen zusammen!
Ich habe zwei Ordner, einen mit ca. 1.200 Dateien und einen mit > 2.500 Dateien. Für beide Ordner bekomme ich Excel-Tabellen welche auflisten was in den Ordnern zu sein hat. Die Dateinamen in den Ordnern bauen sich grundsätzlich nach folgendem Schema auf: "nummer_name1_name2.pdf". In der Excel-Tabelle ist Nummer, Name1 und Name2 jeweils auf eine Spalte aufgeteilt. In der Tabelle ist die Nummer grundsätzlich auf vier Stellen formatiert, bei der Dateibezeichnung wurden führende Nullen weggelassen. Bei den Dateinamen wurden Buchstaben wie "ä" oder "ß" in "ae" und "ss" umgewandelt, in der Tabelle wurde das nicht gemacht... Während ich das früher vierteljährlich per Hand verglichen habe (da waren es auch noch nicht so viele Dateien), wird das inzwischen ein riesiger Aufwand.
Um das zu "automatisieren" habe ich mir folgendes gedacht: Prinzipiell reicht es mir zunächst nur nach Nummern zu vergleichen. Also habe ich den Verzeichnisinhalt in eine *.txt schreiben lassen.
1 | ls -AR ... > Liste.txt |
Als Nächstes hole ich mir die Spalte "Nummer" einfach via copy+paste aus der Tabelle und füge sie in eine zweite *.txt ein.
Das hat zur Folge, dass ich jetzt zwei txt-Dateien mit grundsätzlich unterschiedlichem Inhalt habe. Den Inhalt kann ich ja jetzt nicht Zeile für Zeile vergleichen lassen, da in der einen Datei nur die vierstelligen Nummern stehen und in der anderen Datei der vollständige Dateiname mit einer "verkürzten" Nummer.
Wie kann ich die beiden Dateien sinnvoll vergleichen? Mir würde dabei vollkommen ausreichen einen getrennten Vergleich nach Namen und Nummern zu starten. Also im ersten Durchgang Nummern zu vergleichen und in einem zweiten Durchgang Namen zu vergleichen. Gibt es ein Proggi welches das in einer grafischen Oberfläche lösen kann?
Danke!