我正在处理stackoverflow数据转储.csv文件,我需要找到问题分数的分布。
我在R中打开文件并提取了我需要的两个列,即PostTypeID和Score。
示例:
我需要找到:
得分列中有3行,得分为11。
得分列中有2行,得分为3。 ......等等。
事情是数据是两大,它有300万行 我不知道如何分发。注意:我是R的初学者,所以我需要最简单的方法来做到这一点。
答案 0 :(得分:1)
x = data [,score == 3]以获得得分为3的行
答案 1 :(得分:1)
您正在寻找table
功能。
如果d
是您的数据结构,那么您需要
table(d$Score)