PHP的最佳XML解析器

时间:2008-10-09 17:57:07

标签: php xml parsing xml-parsing

之前我使用过XML Parser,虽然它运行正常,但我对它一般不满意,感觉就像是在使用基本功能的东西。

我最近看过SimpleXML,但我还没有尝试过。它更简单吗?两者有哪些优点和缺点?您使用过的任何其他解析器吗?

6 个答案:

答案 0 :(得分:102)

我不得不说SimpleXML占用蛋糕,因为它首先是一个用C语言编写的扩展,并且非常快。但其次,解析后的文档采用PHP对象的形式。因此,您可以像$root->myElement一样“查询”。

答案 1 :(得分:40)

查看PHP的available XML extensions并查看http://devzone.zend.com/243/http://devzone.zend.com/1035/以了解这些内容。

XML Parser和SimpleXML之间的主要区别在于后者不是拉解析器。 SimpleXML构建在DOM扩展之上,并将整个XML文件加载到内存中。像XMLReader这样的XML Parser只会将当前节点加载到内存中。您可以为特定节点定义处理程序,这些处理程序将在Parser遇到它时触发。这样更快,节省内存。你因为无法使用XPath而付费。

就我个人而言,我发现SimpleXml在DOM上提供的功能非常有限(因此很简单)。你可以轻松地在DOM和SimpleXml之间切换,但我通常不会费心去直接使用DOM路由。 DOM是W3C DOM API的一个实现,因此您可能熟悉其他语言,例如JavaScript。

答案 2 :(得分:24)

这是一个非常有用的功能,可以在扩展名不可用时快速轻松地进行xml解析:

<?php
/**
 * Convert XML to an Array
 *
 * @param string  $XML
 * @return array
 */
function XMLtoArray($XML)
{
    $xml_parser = xml_parser_create();
    xml_parse_into_struct($xml_parser, $XML, $vals);
    xml_parser_free($xml_parser);
    // wyznaczamy tablice z powtarzajacymi sie tagami na tym samym poziomie
    $_tmp='';
    foreach ($vals as $xml_elem) {
        $x_tag=$xml_elem['tag'];
        $x_level=$xml_elem['level'];
        $x_type=$xml_elem['type'];
        if ($x_level!=1 && $x_type == 'close') {
            if (isset($multi_key[$x_tag][$x_level]))
                $multi_key[$x_tag][$x_level]=1;
            else
                $multi_key[$x_tag][$x_level]=0;
        }
        if ($x_level!=1 && $x_type == 'complete') {
            if ($_tmp==$x_tag)
                $multi_key[$x_tag][$x_level]=1;
            $_tmp=$x_tag;
        }
    }
    // jedziemy po tablicy
    foreach ($vals as $xml_elem) {
        $x_tag=$xml_elem['tag'];
        $x_level=$xml_elem['level'];
        $x_type=$xml_elem['type'];
        if ($x_type == 'open')
            $level[$x_level] = $x_tag;
        $start_level = 1;
        $php_stmt = '$xml_array';
        if ($x_type=='close' && $x_level!=1)
            $multi_key[$x_tag][$x_level]++;
        while ($start_level < $x_level) {
            $php_stmt .= '[$level['.$start_level.']]';
            if (isset($multi_key[$level[$start_level]][$start_level]) && $multi_key[$level[$start_level]][$start_level])
                $php_stmt .= '['.($multi_key[$level[$start_level]][$start_level]-1).']';
            $start_level++;
        }
        $add='';
        if (isset($multi_key[$x_tag][$x_level]) && $multi_key[$x_tag][$x_level] && ($x_type=='open' || $x_type=='complete')) {
            if (!isset($multi_key2[$x_tag][$x_level]))
                $multi_key2[$x_tag][$x_level]=0;
            else
                $multi_key2[$x_tag][$x_level]++;
            $add='['.$multi_key2[$x_tag][$x_level].']';
        }
        if (isset($xml_elem['value']) && trim($xml_elem['value'])!='' && !array_key_exists('attributes', $xml_elem)) {
            if ($x_type == 'open')
                $php_stmt_main=$php_stmt.'[$x_type]'.$add.'[\'content\'] = $xml_elem[\'value\'];';
            else
                $php_stmt_main=$php_stmt.'[$x_tag]'.$add.' = $xml_elem[\'value\'];';
            eval($php_stmt_main);
        }
        if (array_key_exists('attributes', $xml_elem)) {
            if (isset($xml_elem['value'])) {
                $php_stmt_main=$php_stmt.'[$x_tag]'.$add.'[\'content\'] = $xml_elem[\'value\'];';
                eval($php_stmt_main);
            }
            foreach ($xml_elem['attributes'] as $key=>$value) {
                $php_stmt_att=$php_stmt.'[$x_tag]'.$add.'[$key] = $value;';
                eval($php_stmt_att);
            }
        }
    }
    return $xml_array;
}
?>

答案 3 :(得分:14)

嗨,我认为SimpleXml非常有用。 有了它我正在使用xpath;

$xml = simplexml_load_file("som_xml.xml");

$blocks  = $xml->xpath('//block'); //gets all <block/> tags
$blocks2 = $xml->xpath('//layout/block'); //gets all <block/> which parent are   <layout/>  tags

我使用了很多xml配置,这有助于我快速解析它们。 SimpleXml写在C上,所以它非常快。

答案 4 :(得分:11)

这取决于您尝试对XML文件执行的操作。如果您只是尝试读取XML文件(如配置文件),那么Wicked Flea在建议SimpleXML时是正确的,因为它创建的数量相当于嵌套的ArrayObjects。例如值可以通过$ xml-&gt; root-&gt; child。

访问

如果您希望操纵XML文件,最好使用DOM XML

答案 5 :(得分:0)

crxml解析器非常容易解析。

这个类有一个搜索功能,它将一个带有任何名称空间的节点名称作为参数。它在xml中搜索节点并打印出访问语句以使用此类访问该节点。这个类也使xml生成变得非常容易。

您可以在

下载此课程

http://freshmeat.net/projects/crxml

或来自phpclasses.org

http://www.phpclasses.org/package/6769-PHP-Manipulate-XML-documents-as-array.html