对于我的论文,我正在处理推文。我试图只选择包含某些单词的推文。由于我在地理上分析推文,我将它们作为SpatialPointDataFrame(SPDF)。因此,我想在地图上看到关于这些单词的推文来自哪里,所以我想从SPDF中选择它们作为新的SPDF。
我认为使用软件包tm(文本挖掘)或扫描等常规功能应该很容易。但不幸的是,我发现很难找到一个允许我扫描推文中某个单词的函数。我的下一步是解决它,将SPDF中的推文转换为文本文件,使用我尝试使用SPDF的其中一个函数选择推文,然后将它们链接回SPDF以使它们再次成为空间。
在编程语言R中,有人告诉我不要开始制作函数,因为你将尝试制作的大多数函数已经存在。所以在我在这种情况下打破我的大脑之前,我在这里发布它希望有人得到结果。
所以我有一个包含很多推文的SPDF。我想选择包含某个单词的所有推文。就是这样!对我来说这听起来仍然很容易,我觉得我此刻并没有得到正确的思路。
请帮忙!
EDIT !!!!!
all_tweets_containing_word_test_are_true< - grepl(' test',spatialpointdataframe $ twt_txt)
???选择所有真实数量的spatialpointdataframe ???
答案 0 :(得分:1)
在常规数据框中,您可以像这样使用grepl:
Sub.DF <- DF[grepl('test', DF$twt_txt),]
只要SPDF像那样工作,那么这应该是你想要的。如果你只是想绘制它,你甚至不需要制作Sub.DF对象。如果您使用ggplot2或ggmap或其他内容,请使用data=DF[grepl('test', DF$twt_txt),]