Java内部文本(getTextContents())问题

时间:2009-12-07 05:06:01

标签: java xml regex

我正在尝试用Java进行一些解析,我正在使用Cobra HTML Parser将HTML转换为DOM,然后我使用XPath来获取我想要的节点。当我达到所需的级别时,我调用了node.getTextContents(),但这给了我一个像

这样的字符串
"\n\n\nValue\n-\nValue\n\n\n"

是否有内置的方法来摆脱换行符?我想做像RegEx一样的

(?:\s*([^-]+)\s*-\s*([^-]+)\s*)

关于内部文本,我真的不想处理文本之间可能存在的不同空格符号。

示例输入:

Value
-
Value

由于

2 个答案:

答案 0 :(得分:0)

您可以使用String.replaceAll()

String trimmed = original_string.replaceAll("\n", "");

第一个参数是正则表达式:例如,您可以用replaceAll("\\s+", "")替换原始字符串中所有连续的空格块。

答案 1 :(得分:0)

我不完全确定我正确理解了这个问题,但删除所有空格的最简单方法是:

String s = node.getTextContents()。replaceAll(“\\ s”,“”);

如果您只想摆脱前导/尾随空格,请使用trim()。