如何找到将组合指定为多行的组合频率?

时间:2014-02-04 20:53:42

标签: r combinations

我正在查看位置数据,我有一个个人列表,我知道具体的位置和时间。我想要了解的是在任何一天内最常见的地点组合。

id      location    date
00231   home        2014-01-02
00231   gas station 2014-01-02
00231   home        2014-01-02
02830   work        2014-01-02
02830   home        2014-01-02
00231   home        2014-01-04
00231   mcdonalds   2014-01-04

正如您所看到的,可能有许多人具有不同长度的位置组。如何使用R来查找所有潜在组合的频率(对于'订单事项'和'订单无关紧要')。以下是我希望看到的内容:

combination                  freq
home-gas station-home        472
work-home                    439
home-walmart-home            209

另外澄清一下,我现在不需要对这些位置进行任何其他分析,只需要寻找组合分析。

谢谢&如果这是重复的话道歉,但我找不到组合位于多行的任何内容(与许多关于变量/列值组合的示例相比)

1 个答案:

答案 0 :(得分:0)

有很多方法 - 我认为罗伯特是正确的要求你概括

我感觉很慷慨 - 所以使用一些生成的数据 - 一些exaples with table和ddply(whihc输出data.frame)

data1 <- data.frame(value=1:100,group=factor(rep(1:4,25)))
table(data1$group)
ddply(data1,.(group),summarize,N=length(group))
ddply(data1,.(group),summarize,N=length(group),sum1=sum(value),mean1=mean(value))