Hallo,
ich suche in Python einen Regex, der alle Zeichen zwischen "<tr" (ja, ohne >) und "</tr>", jeweils ohne Anführungszeichen aus html_content heraussucht und in tag_zeilen als Array abspeichert.
z. B. so (aber das funktioniert nicht):
| tag_zeilen = re.findall('(?<=<tr).*?(?=</tr>)', str(html_content))
|
Ich vermute, das Problem ist, daß der Inhalt sich über mehrere Zeilen erstreckt. Kann das sein? Wie kann ich den obigen Ausdruck so erweitern, daß er Zeilenwechsel ignoriert?
Grüße und danke,
CJC