如何通过r查找哪些推文包含主题标签

时间:2018-03-27 00:36:00

标签: r

我有5条来自推文的文字。 我想知道哪一个有标签。 Text 找到它的逻辑向量是什么?

2 个答案:

答案 0 :(得分:0)

您可以通过

实现这一目标
/description

请注意,您的文本数据向量假定为grepl("#", text) 。这将返回text s和TRUE s。

的向量

答案 1 :(得分:0)

您可以获取与grep

匹配的推文的索引
Tweets = c("sefgfg efgwre", "asdwfg #ABC erwthtr", "#wdfv efgv ertbv",
    "wetg rth fgwetgr", "adsfd v verfwf df #ghqwef")
grep("#\\w", Tweets)
[1] 2 3 5

如果您想了解主题标签的内容,可以使用regexprregmatches

分两步执行此操作
m = regexpr("#\\S+", Tweets)
regmatches(Tweets, m)
[1] "#ABC"    "#wdfv"   "#ghqwef"