这是给Matlab的。我有一条推文,我需要找到主题标签的内容。我知道我可以隔离并保存一个变量,以“#”开头,以“使用正则表达式结束”。但是,当我使用
时 tweet = 'it is fun to post on #stackoverflow, really #itis';
regexp(tweet,'#(\w+)','tokens','once')
ans =
'stackoverflow'
我只得到第一个#。我怎么做到这样我才能得到“itis”#?
答案 0 :(得分:4)
once
仅返回第一场比赛....如果您不想要,请删除。
答案 1 :(得分:0)
根据matlab文档,您需要删除一次'。 资源: http://www.mathworks.com/help/matlab/ref/regexp.html
答案 2 :(得分:0)
我认为这就是你要找的东西:
regexp(tweet,'#(\w+)','match')
ans =
'#stackoverflow' '#itis'
然而,似乎你比我更了解Regex,所以我想你知道如何摆脱字符串中的#
。