ubuntuusers.de

Vervollständigen Sie dieses Perl/Bash-Skript für eine URL und für eine Liste von URLs

Status: Ungelöst | Ubuntu-Version: Ubuntu 20.04 (Focal Fossa)
Antworten |

gasper

Anmeldungsdatum:
16. Januar 2022

Beiträge: Zähle...

Vervollständigen Sie dieses Perl/Bash-Skript für eine URL und für eine Liste von URLs Sagen Sie mir, wie ich mehrere Regex im selben Skript schreiben kann?

1
2
3
4
5
6
7
wget -Otest.html https://www.cormes.de/impressum
perl -nE 'if (/\bmailto:([\w\.]+\@[\w\.]+)/) { say $1 }' test.html
perl -nE 'if (/Straße: \[A-Za-z] [0-9]/) {say $1}'test.html 
perl -nE 'if ( /PLZ und Ort: \ [0-9] {5} - [A-Za-z]) /{say $1}'test.html 
perl -nE 'if (/FirstName and LastName: \[A-Za-z] [A-Za-z])/{say $1}'test.html
perl -nE 'if( 's|\([0-9]{2}\)-[0-9]{3}-[0-9]{3}-[0-9]{2}-[0-9]{2}|##-###-###-##-##|g')
https://idowapro.de/impressum/#:~:text=Gesch%C3%A4ftsf%C3%BChrer%3A%20Lutz%20Teubert

Hier der Link des Namens des CEO, aber ich weiß nicht, welches Tool verwendet wird, um ihn zu entschlüsseln und im Skript zu verwenden Um eine E-Mail zu extrahieren, funktioniert diese Regex gut. Die andere Regex wird durch Regex 101 validiert.

Bearbeitet von sebix:

Bitte verwende in Zukunft Codeblöcke, um die Übersicht im Forum zu verbessern!

Moderiert von noisefloor:

Ins Forum "Shell und Programmieren verschoben, weil Frage zu Perl.

Doc_Symbiosis

Avatar von Doc_Symbiosis

Anmeldungsdatum:
11. Oktober 2006

Beiträge: 4453

Wohnort: Göttingen

Hallo,

willkommen hier im Forum! Es ist sehr löblich, dass Du gleich Codeblöcke verwenden willst, allerdings verwendest Du die wohl falsch. Codeblöcke leitest Du mit '{{{' ein und setzt am Ende '}}}'

Und Du willst die ganzen Regexp in ein Perl-Skript packen oder in ein Bash-Skript? Und Du willst dann diesem Skript eine URL als Parameter übergeben oder wie soll das sein?

gasper

(Themenstarter)

Anmeldungsdatum:
16. Januar 2022

Beiträge: 2

Hallo,

Perl- oder Bash-Skript Das am besten geeignete Skript für diesen Fall. und nachdem ich dieses Skript für eine Liste von URLs verwenden möchte.

Doc_Symbiosis

Avatar von Doc_Symbiosis

Anmeldungsdatum:
11. Oktober 2006

Beiträge: 4453

Wohnort: Göttingen

Also mir ist dein Vorhaben noch nicht ganz klar. Eine Mailadresse aus dem mailto rauszuziehen geht ja sicherlich, aber die Adressdaten herauszuziehen ist nicht so einfach, wenn man nicht standardisierte Webseiten hat.

schragge

Anmeldungsdatum:
27. Januar 2022

Beiträge: 181

gasper schrieb:

https://idowapro.de/impressum/#:~:text=Gesch%C3%A4ftsf%C3%BChrer%3A%20Lutz%20Teubert

Hier der Link des Namens des CEO, aber ich weiß nicht, welches Tool verwendet wird, um ihn zu entschlüsseln und im Skript zu verwenden

perl -MURI::Escape -ne 'print uri_unescape($_)'

Funktioniert mit Perl 5.26 und liburi-perl 1.73 (d.h. Bionic). Ältere Perl-Versionen hatten Probleme mit UTF-8. Siehe https://stackoverflow.com/questions/13163937

rklm Team-Icon

Projektleitung

Anmeldungsdatum:
16. Oktober 2011

Beiträge: 13219

In dem Skript fehlen Leerzeichen an verschiedenen Stellen vor dem Dateinamen. Auch der Ansatz, ein Shell-Skript zu schreiben und von da aus mehrfach Perl aufzurufen ist nicht wirklich optimal.

Antworten |