Mahlzeit !
phonepack-de besteht aus drei Progrämmchen für die Kommandozeile zum phonetischen durchsuchen von Textdaten und codieren/vergleichen von Namen/Worten.
Wenn man sich mit Genealogie befaßt oder einen Text aus anderen Gründen phonetisch durchsuchen möchte kommt man mit normalen Suchfunktionen oder Reg-Ex nicht weit. Dafür gibt es phonetische Such- Codierverfahren. Wenn man in einem Text z.B. einem Adressbuch den Namen Müller suchen will, sucht man unter M und findet dann auch alle Müller, Mueller, Myllar, Mühler. Schwieriger wird’s schon wenn man nach so etwas wie Czerny sucht und den Namen nur vom Hören kennt. In den verschiedenen Schreibweisen sucht man sich dann einen Wolf. Ganz verloren ist man wenn die Namen im Text wild versteut sind und man nicht weiß wie sie geschrieben werden oder alle Namensvarianten ausgegeben haben möchte.
Das Programmpaket besteht aus: phonecode-de: Wandelt einen Namen/Wort in einen phonetischen Code phonecomp-de: Vergleicht zwei Namen/Worte ob sie phonetisch identisch sind phoneshow-de: Arbeitet ähnlich grep, aber mit phonetischer Suche
Momentan sind folgende phonetische Verfahren eingebaut: Kölner Phonetik Phonem Soundex Extended Soundex
Anhang runterladen ins Home Verzeichnis entpacken In den Ordner navigieren, Terminal öffnen (oder anders rum) "sudo bash install.sh" erstellt die Programme und installiert sie in /usr/local/bin Alternativ "bash build.sh" erstellt die Programme im Ordner ohne Installation. gcc muß dazu installiert sein.
Zum Testen liegt ein Adressbuch in Textform im Ordner. cat adressbuch.txt | phoneshow-de Müller Meier Schmitt Oder falls nur "build" ausgeführt: cat adressbuch.txt | ./phoneshow-de Müller Meier Schmitt Zeigt jetzt alle Zeilen der Textdatei an in denen sich phonetisch ähnliche Begriffe wie die 3 Namen befinden. phoneshow-de -h zeigt die ausführliche Hilfe phonecode-de & phonecomp-de sollten selbsterklärend sein. Bei Aufruf ohne Parameter wird ebenfals eine kurze Info angezeigt.
Aufgrund der phonetischen Verfahren sind nur deutsche Worte erlaubt. Also alles was A-Z, a-z, AÖÜäöüß ist. Gesucht und gefunden werden keine Namen mit... wie heißt der Strich über'm e oder sonst was 😉
Wer was damit Anfangen kann: Viel Spaß damit