ubuntuusers.de

sed -e / <TD .* bis bestimmtes Zeichen kommt //g

Status: Gelöst | Ubuntu-Version: Ubuntu 10.10 (Maverick Meerkat)
Antworten |

thorsten1896

Anmeldungsdatum:
5. November 2006

Beiträge: 67

Hi, ich suche eine möglichkeit um bestimmte zeichen zu löschen

z.B. aus einer Webseite:

<li><a href="http://forum.ubuntuusers.de/last24/">24 Stunden</a></li> <li><a href="http://forum.ubuntuusers.de/last12/">12 Stunden</a></li> <li><a href="http://forum.ubuntuusers.de/last6/">6 Stunden</a></li>

Ich möchte diesen PArt löschen. <li><a .* -löschen- bis die klammer wieder geschlossen wird. >

der Part nach der spitzen klammer ">" soll weiterhin bestehen bleiben.

Vain

Avatar von Vain

Anmeldungsdatum:
12. April 2008

Beiträge: 2510

Servus,

reguläre Ausdrücke und HTML/XML ist zwar immer so eine Sache, aber manchmal geht’s halt schon irgendwie. Du könntest es hiermit versuchen:

sed -r 's/<li><a [^>]+>//g'

Auf Deutsch heißt das, dass nach dem „a “ ein oder mehr Zeichen kommen müssen, die kein Größer-Als-Zeichen sind, und danach ein Größer-Als-Zeichen. Dieser ganze Kram wird dann gelöscht.

HTH. ☺

Antworten |