加快使用PHP中的DOMDocument类和命名空间解析XML文档

时间:2017-03-28 11:07:20

标签: php xml parsing dom

我需要使用PHP解析6个XML文档。 每个文件都有50000个元素,因此我需要快速解析器,所以我选择了DOMDocument类。 XML文件的示例是:

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<ns2:PinsCountryCodeIds xmlns:ns2="http://apis-it.hr/umu/2015/types/kp">
    <ns2:PinCountryCodeId>
        <ns2:CountryCodeId>HR</ns2:CountryCodeId>
        <ns2:PinPrimatelja>000000000</ns2:PinPrimatelja>
    </ns2:PinCountryCodeId>
    <ns2:PinCountryCodeId>
        <ns2:CountryCodeId>HR</ns2:CountryCodeId>
        <ns2:PinPrimatelja>000000001</ns2:PinPrimatelja>
    </ns2:PinCountryCodeId>
    <ns2:PinCountryCodeId>
        <ns2:CountryCodeId>HR</ns2:CountryCodeId>
        <ns2:PinPrimatelja>000000002</ns2:PinPrimatelja>
    </ns2:PinCountryCodeId>
</ns2:PinsCountryCodeIds>

我提出的最好的是这段代码:

$input_file=scandir($OIB_path);//Scanning directory for files
foreach ($input_file as $input_name){
    if($input_name=="." || $input_name=="..")
        continue;
    $OIB_file=$OIB_path . $input_name;

    $doc = new DOMDocument();
    $doc->load( $OIB_file );

    $doc->saveXML();
    foreach ($doc->getElementsByTagNameNS('http://apis-it.hr/umu/2015/types/kp', 'PinPrimatelja') as $element) {
        echo  $element->nodeValue, ', <br> ';
    }           

}

但它太慢了,解析6个文件需要20多分钟。

我可以做些什么来改善它?

1 个答案:

答案 0 :(得分:1)

Xpath查询比使用DOM进行正常遍历要快得多。

尝试下面的代码并告诉我它是否可以提高性能。

<?php

$input_file=scandir($OIB_path);//Scanning directory for files

foreach ($input_file as $input_name){

    if($input_name=="." || $input_name=="..")
        continue;
    $OIB_file=$OIB_path . $input_name;

    $doc = new DOMDocument();
    $doc->load( $OIB_file );

    $xpath = new DOMXPath($doc);
    $xpath->registerNameSpace('x', 'http://apis-it.hr/umu/2015/types/kp');

    $elements = $xpath->query('//x:PinCountryCodeId/x:PinPrimatelja');

    if ($elements->length > 0) {
        foreach ($elements as $element) {
            echo $element->nodeValue.'<br>';
        }

    }

}

?>