我使用了几个不同的版本来执行此操作,但似乎都会导致此错误:
[致命错误]:1:171:前缀“xmlns”无法明确绑定到任何名称空间; “xmlns”的命名空间也不能明确地绑定到任何前缀。
我将html加载为:
// Load html file
def fis=new FileInputStream("2.html")
def html=new XmlSlurper(new org.cyberneko.html.parsers.SAXParser()).parseText(fis.text)
我试过的版本:
http://johnrellis.blogspot.com/2009/08/hmmm_04.html
import groovy.xml.StreamingMarkupBuilder
import groovy.xml.XmlUtil
def streamingMarkupBuilder=new StreamingMarkupBuilder()
println XmlUtil.serialize(streamingMarkupBuilder.bind{mkp.yield html})
http://old.nabble.com/How-to-print-XmlSlurper%27s-NodeChild-with-indentation--td16857110.html
// Output
import groovy.xml.MarkupBuilder
import groovy.xml.StreamingMarkupBuilder
import groovy.util.XmlNodePrinter
import groovy.util.slurpersupport.NodeChild
def printNode(NodeChild node) {
def writer = new StringWriter()
writer << new StreamingMarkupBuilder().bind {
mkp.declareNamespace('':node[0].namespaceURI())
mkp.yield node
}
new XmlNodePrinter().print(new XmlParser().parseText(writer.toString()))
}
有什么建议吗?
谢谢! 米莎
答案 0 :(得分:5)
问题是命名空间。这是解决方案:
def saxParser=new org.cyberneko.html.parsers.SAXParser()
saxParser.setFeature('http://xml.org/sax/features/namespaces',false)
new XmlSlurper(saxParser).parseText(text)
import groovy.xml.XmlUtil
println XmlUtil.serialize(new StreamingMarkupBuilder().bind {
mkp.yield page
})
谢谢! 米莎
答案 1 :(得分:0)
仍然没有答案,但如果我使用XmlParser那么
def html=new XmlSlurper(new org.cyberneko.html.parsers.SAXParser()).parseText(somehtml)
new XmlNodePrinter(preserveWhitespace:true).print(html)
很漂亮。
此外,如果你得到一个StreamingMarkupBuilder,你可以这样做:
import groovy.xml.XmlUtil
println XmlUtil.serialize(new StreamingMarkupBuilder().bind {
... make your markup here ...
}
)
米莎