格式错误的XML清理 - 数据不在标签中

时间:2012-09-26 16:03:16

标签: php xml malformed

所以我使用带有完美嵌套标签的XML,但是我最终会在标签之外直接使用奇怪的字符,例如:

<root><a_tag>Some perfectly valid string</a_tag> this
<b_tag>more data</b_tag>  
<c_tag>some more data</c_tag> 0</root>

PHP中是否存在本地执行此操作的功能,还是需要正则表达式来完成它?

只有我正在运行的功能来自这个答案:https://stackoverflow.com/a/3466049

编辑:使用emacs打开文件时,每行的结尾都有一组字符,例如:^ @或^ @ S

此外 - 这些文件是使用InDesign生成的。

谢谢!

1 个答案:

答案 0 :(得分:0)

经过大量浪费时间后,问题只是Adobe InDesign在导出的XML中产生了许多奇怪的字符 - 最终解决方案最终改变了一个名为的InDesign设置:

Remap Break, Whitespace, and Special Characters

它立即解决了XML问题。