使用单引号解析XML?

时间:2008-09-25 15:23:06

标签: php xml xml-parsing html-entities

我目前遇到一个问题,其中一个元素从我的xml文件返回,其中包含一个引号。这导致xml_parse将其分解为多个块,例如:获取有线,你被雇用了! 然后输入为'Get Wired,You'是一个对象,单引号是第二个,并且'被雇用了!'作为第三个。

我想做的是:

while($data = fread($fp, 4096)){
        if(!xml_parse($xml_parser, htmlentities($data,ENT_QUOTES), feof($fp))) {
            break;
        }
    }

但这一直在打破。我可以运行一个str_replace来代替htmlentities,它可以毫无问题地运行,但不想使用htmlentities。

有什么想法吗?

更新 根据JimmyJ在下面的回复,我尝试了以下解决方案但没有运气(仅供参考,或者在链接帖子上方有两个响应更新直接链接的代码):

function XMLEntities($string)
    {
        $string = preg_replace('/[^\x09\x0A\x0D\x20-\x7F]/e', '_privateXMLEntities("$0")', $string);
        return $string;
    }

    function _privateXMLEntities($num)
    {
    $chars = array(
        39  => ''',
        128 => '€',
        130 => '‚',
        131 => 'ƒ',
        132 => '„',
        133 => '…',
        134 => '†',
        135 => '‡',
        136 => 'ˆ',
        137 => '‰',
        138 => 'Š',
        139 => '‹',
        140 => 'Œ',
        142 => 'Ž',
        145 => '‘',
        146 => '’',
        147 => '“',
        148 => '”',
        149 => '•',
        150 => '–',
        151 => '—',
        152 => '˜',
        153 => '™',
        154 => 'š',
        155 => '›',
        156 => 'œ',
        158 => 'ž',
        159 => 'Ÿ');
        $num = ord($num);
        return (($num > 127 && $num < 160) ? $chars[$num] : "&#".$num.";" );
    }
if(!xml_parse($xml_parser, XMLEntities($data), feof($fp))) {
            break;
        }

更新:根据下面的汤姆问题,魔法引号确实已关闭。

解决方案:我最终解决问题的方法如下:

收集每个单独项目/帖子/等的数据后,我将该数据存储到我稍后用于输出的数组中,然后清除收集期间使用的局部变量。我添加了一个步骤,检查数据是否已经存在,如果是,我将它连接到最后,而不是覆盖它。

所以,如果我最终得到三个块(如上所述,让我们坚持'获取有线,你被雇用了!',我将继续做下去

$x = 'Get Wired, You'
$x = "'"
$x = 're Hired!'

要做:

$x = 'Get Wired, You' . "'" . 're Hired!'

这不是最佳解决方案,但似乎有效。

2 个答案:

答案 0 :(得分:2)

我认为启用魔术引号有时会搞乱xml解析 - 这是启用吗?您可以使用

在运行时禁用它
set_magic_quotes_runtime(0);

编辑:如果源不是post或get,这可能不相关,但我在PHP手册中读到它可能会导致奇怪的行为

答案 1 :(得分:1)

为什么不使用simplexml_load_file之类的东西来轻松解析文件?