String拆分不拆分每个空间

时间:2017-08-19 18:57:53

标签: java jsoup

我正在尝试按空格分割字符串。该字符串是我使用Jsoup提取的html页面的内容:

Element bodyElement = doc.body();
String bodyText = bodyElement.text();

这很奇怪:字符串包含子字符串“above not not”,但是这个特定的子字符串不会被拆分。 我用了代码:

String[] s1 = bodyText.split(" ");

我也试过了:

String[] s1 = bodyText.split("\\s");

而且我几乎得到了所有的东西(好吧,有几个词的hundrads所以我没有通过他们每个人,但据我所知)除了提到的两个具体的词。 如果它是相关的,那么包含这些词的段落是(在删除停用词之后):

  

使用上面的方法添加属性对象是不可能的点表示法,它只能接受文字成员名称,变量值指向名称。

分裂后:

adding
property
object
using
method
above isn't
possible
dot
notation,
... //all the rest.. 
word.

当我尝试复制粘贴段落并拆分时,它工作正常,所以我假设它与Jsoup解析有关,但我不确定。

任何想法为什么会发生这种情况以及如何解决?感谢

0 个答案:

没有答案