Hi,
ich hab mir nen kleinen RSS-Feed-Agregator in PHP geschrieben und da ist mir was aufgefallen.
Also erstmal: ich verwende die PHP-Funktion xml_parse_into_struct(), welche eine XML-Datei zu einem Array parst. Und diese Funktion hat manchmal Probleme mit der RSS-Datei von ubuntuusers.de.
Für diesen Thread http://forum.ubuntuusers.de/topic/42328/?highlight= wird folgender XML-Code erzeugt:
<item> <title>Fehlermeldung "Xserver kann nicht gestartet werden"</title> <link>http://forum.ubuntuusers.de/topic/42328/</link> <description><![CDATA[]]></description> <pubDate>1155064049</pubDate> </item>
Im Titel sind Anführungsstriche und diese werden mit " kodiert. Aber beim letzten fehlt der Strichpunkt. Und dies macht xml_parse_into_struct() Probleme.
Wie kommt es jetzt dazu dass hier der Strichpunkt fehlt? Es ist auch schon vorgekommen dass mehr fehlt und z.B. nur &qu da steht. Fehler im RSS-Generator?
Wieso macht da jetzt die PHP-Funktion Probleme? Bug in der Funktion? Oder führt dieses fehlende Zeichen zu nicht validem XML?