我正在尝试按空格分割字符串。该字符串是我使用Jsoup提取的html页面的内容:
Element bodyElement = doc.body();
String bodyText = bodyElement.text();
这很奇怪:字符串包含子字符串“above not not”,但是这个特定的子字符串不会被拆分。 我用了代码:
String[] s1 = bodyText.split(" ");
我也试过了:
String[] s1 = bodyText.split("\\s");
而且我几乎得到了所有的东西(好吧,有几个词的hundrads所以我没有通过他们每个人,但据我所知)除了提到的两个具体的词。 如果它是相关的,那么包含这些词的段落是(在删除停用词之后):
使用上面的方法添加属性对象是不可能的点表示法,它只能接受文字成员名称,变量值指向名称。
分裂后:
adding
property
object
using
method
above isn't
possible
dot
notation,
... //all the rest..
word.
当我尝试复制粘贴段落并拆分时,它工作正常,所以我假设它与Jsoup解析有关,但我不确定。
任何想法为什么会发生这种情况以及如何解决?感谢