Question

我正在尝试用Java进行一些解析，我正在使用Cobra HTML Parser将HTML转换为DOM，然后我使用XPath来获取我想要的节点。当我达到所需的级别时，我调用了node.getTextContents（），但这给了我一个像

这样的字符串

"\n\n\nValue\n-\nValue\n\n\n"

是否有内置的方法来摆脱换行符？我想做像RegEx一样的

(?:\s*([^-]+)\s*-\s*([^-]+)\s*)

关于内部文本，我真的不想处理文本之间可能存在的不同空格符号。

示例输入：

Value
-
Value

由于

Answer 1

String trimmed = original_string.replaceAll("\n", "");

第一个参数是正则表达式：例如，您可以用replaceAll("\\s+", "")替换原始字符串中所有连续的空格块。

Answer 2

我不完全确定我正确理解了这个问题，但删除所有空格的最简单方法是：

String s = node.getTextContents（）。replaceAll（“\\ s”，“”）;

如果您只想摆脱前导/尾随空格，请使用trim（）。