Stránky

sobota 25. února 2012

Nevalidní znaky v řetězcích při pársování XML

Objevují se v XML datech z externího zdroje nevalidní znaky? Potom
new SimpleXMLElement($data);
vyhodí chybu a data nelze ani v případě jediného zbloudilého nevalidního znaku pársovat.

Naštěstí stačí málo. Rozšíření PHP Tidy a přidat jeden řádek před inicializaci SimpleXML:

$data = tidy_repair_string($data, array('input-xml' => true, 'output-xml' => true), 'UTF8');

Žádné komentáře:

Okomentovat