遇到新线和空格时分词

时间:2014-05-06 11:43:06

标签: regex matlab

如何在每个数组中存储的单词中分割段落?我只能在遇到每个单词之间的空格时分割单词,但在遇到新单词时无法拆分它。遇到新行时,这些单词将组合在一起(例如:第1行的最后一个单词与第二行的第1个单词组合在一起)

word_newLine = regexp(CharData, '\n', 'split')

word = regexp(word_newLine, ' ', 'split')

“CharData”

enter image description here

1 个答案:

答案 0 :(得分:2)

使用函数strsplit,您可以拆分包含多个分隔符的字符串。

例如,您可以这种方式拆分段落:

words = strsplit(CharData, {' ','\n'});

修改

正如评论中所述,strsplit附带了Matlab 2013.在该版本之前,有一种可能性确实是使用regexp,方式如下:

words = regexp(CharData,'\s+','split');

它将char数组与空格(空格,制表符,回车符)分开。