我正在尝试用Java进行一些解析,我正在使用Cobra HTML Parser将HTML转换为DOM,然后我使用XPath来获取我想要的节点。当我达到所需的级别时,我调用了node.getTextContents(),但这给了我一个像
这样的字符串"\n\n\nValue\n-\nValue\n\n\n"
是否有内置的方法来摆脱换行符?我想做像RegEx一样的
(?:\s*([^-]+)\s*-\s*([^-]+)\s*)
关于内部文本,我真的不想处理文本之间可能存在的不同空格符号。
示例输入:
Value
-
Value
由于
答案 0 :(得分:0)
您可以使用String.replaceAll()。
String trimmed = original_string.replaceAll("\n", "");
第一个参数是正则表达式:例如,您可以用replaceAll("\\s+", "")
替换原始字符串中所有连续的空格块。
答案 1 :(得分:0)
我不完全确定我正确理解了这个问题,但删除所有空格的最简单方法是:
String s = node.getTextContents()。replaceAll(“\\ s”,“”);
如果您只想摆脱前导/尾随空格,请使用trim()。