我基于搜索两个主题标签从Instagram收集数据: hashtagA(= 1)的帖子和hashtagB(= 2)的帖子,以'group'编码。
我的数据框现在看起来像这样: 一行是一个帖子。
group hashtags
1 #something #anything #sunnyday
1 #wokeuplikethis #Monday
1 #something #Monday #yolo
2 #yolo #Monday #hustle
2 #sunnyday #lake #work
2 #yolo #rock #hustle
1 #anything
2 #anything #new
我想我需要一个嵌套的数据结构(带有几个主题标签的1个帖子)来分析共同发生的主题标签并获得经常一起出现的主题标签网络。 您可以推荐哪些代码/包用这个最小可重复数据集进行共词分析?