标签: java regex
我试图找出正则表达式用于将一篇文章分成没有标点符号的单词。我尝试用空格分割,但是这给了一些带有标点符号的标记。我还试图通过单词字符分割,由于某种原因返回了一个空字符串数组:
String[] words = line.split("\\w+");
答案 0 :(得分:1)
试试这个
String[] words = line.split("\\W+");