剥离换行符在XML之前留下空格 - 正确的方法是什么?

时间:2013-04-08 05:49:32

标签: php xml

我想知道从XML目标PHP字符串中删除换行符的建议方法。使用以下方法,我在XML标记之间留下了2-4个不同的空格。

$current = $xml->saveXML();
$current = str_replace(array("\r\n", "\r", "\n"), "", $current);

删除换行符的正确语法是什么,以便XML标记端到端显示,而不在它们之间添加空格?

1 个答案:

答案 0 :(得分:1)

首先是一些基本的东西:$xml->saveXML()表明你正在使用SimpleXML。它只在输出中使用一个行分隔符:"\n"

因此,搜索"\r\n""\r"是错误的。使用str_replace()也不是一个好主意,您应该使用strtr()代替:

$current = strtr($current, array("\n" => ''));

由于此替换了换行符,因此不会删除或更改XML元素之间的空格字符。

但是,这些空格字符在很大程度上取决于您的输入XML。在XML中你可以有重要的(删除它将是一个失败)和非重要的空格(保存删除)但 Simplexml DOMDocument 不会(并且不能)知道哪一个是哪个。

由于图书馆本身不知道,你需要告诉他们。例如,看起来您正在寻找所有文本节点的修剪。由于 SimpleXMLElement 允许访问文本节点,因此您需要使用 DOMXPath 。但不要害怕,这并不复杂:

$doc   = dom_import_simplexml($xml)->ownerDocument;
$xpath = new DOMXPath($doc);
foreach ($xpath->query('//text()') as $text) {
    $text->data = trim($text->data);
}

这只是按文档顺序迭代所有文本节点并修剪它们。

然后,您只需要从document元素开始获取XML。这将剥离XML声明和任何前面的注释和处理指令(我假设你想要那样):

$current = $doc->saveXML($doc->documentElement);

如果不是,则应用上面的行分隔符规则。然后你可以改为:

$current = $xml->saveXML();
$current = strtr($current, array("\n" => ''));

就是这样。我希望这有用。