在Pentaho中清除字符串中的错误XML字符

时间:2019-03-12 20:40:53

标签: javascript xml pentaho pentaho-data-integration

问题:通过Web /应用程序/文件交换接收不良XML。

我正在通过HTTP GET接收XML响应,该响应有时在文本中包含错误的XML字符。 enter image description here

该字符SUB显示在文本和“从XML获取数据”中  步骤将无法读取,说明 在文档的元素内容中发现了无效的XML字符(Unicode:0x1a)

1 个答案:

答案 0 :(得分:0)

在此Post中找到了解决方案。

我不需要使用答案中包含的整个JavaScript函数,而不必使用XML中不允许使用的部分字符。

我所做的是'Modified Java Script Value'中的一个简单的Replace()函数

  

var str = result.replace(/ [^ \ x09 \ x0A \ x0D \ x20- \ xFF \ x85 \ xA0- \ uD7FF \ uE000- \ uFDCF \ uFDE0- \ uFFFD] / gm,''); < / p>

这清除了整个XML中的错误字符,并使整个XML可读。