我正在对推文进行文本挖掘,我已经从不同的帐户中收集了关于某个主题的随机推文,我将推文转换为数据框,我能够在这些推文中找到最频繁的推文(通过使用列“screenName” “)......就像那些推文:
[1]“ISCSP_ORG:#cybercrime NetSafe发布网络钓鱼指南: 奥克兰,2013年6月4日,星期一 - 大多数新西兰人将...... http://t.co/dFLyOO0Djf“
[1]“ISCSP_ORG:#cybercrime Business Briefs:MILL CREEK - H.M. Jackson 高中DECA分会成员赢得了组织...... http://t.co/auqL6mP7AQ“
[1]“BNDarticles:你如何保护你的#smallbiz免受#cybercrime的攻击? 以下是他们进入的前3种新方式。如何阻止他们。 http://t.co/DME9q30mcu“
[1]“TweetMoNowNa:RT @jamescollinss:@senatormbishop它是一样的 我在与#cybercrime的斗争中遇到的问题。 \“既得 兴趣\“ - 告诉我,如果......”
[1]“jamescollinss:@senatormbishop我遇到了同样的问题 在与#cybercrime的斗争中。 “既得利益” - 告诉我 如果你找到方法!“
有不同的推文发送了很多推文(在收集的数据集中)
现在,我想为相应的推特/用户收集/分组相关的推文。 有什么办法可以用R ??有什么建议吗?非常感谢你的帮助。