请考虑以下事项:
String s = "<tag>This has a <a href=\"#\">link<a>.</tag>";
final XML xml = new XMLDocument(s);
String extractedText = xml.xpath("//tag/text()").get(0);
System.out.println(extractedText); // Output: This has a <a href="#">link</a>.
System.out.println(s.contains(extractedText)); // Output: false!
System.out.println(s.contains("This has a <a href=\"#\">link<a>.")); // Output: true
我有一个XML文件,它是一个带有一些转义HTML的字符串。使用jcabi库,我得到相关元素的文本(在这种情况下,<tag>
s中的所有内容)。但是,我得到的并不是原始字符串中的内容 - 我期待<
和>
,而是获得<
和>
。矛盾的是,原始字符串 not 包含我从中提取的子字符串。
如何获取实际文本而不是非转义版本?