我正在查看位置数据,我有一个个人列表,我知道具体的位置和时间。我想要了解的是在任何一天内最常见的地点组合。
id location date
00231 home 2014-01-02
00231 gas station 2014-01-02
00231 home 2014-01-02
02830 work 2014-01-02
02830 home 2014-01-02
00231 home 2014-01-04
00231 mcdonalds 2014-01-04
正如您所看到的,可能有许多人具有不同长度的位置组。如何使用R来查找所有潜在组合的频率(对于'订单事项'和'订单无关紧要')。以下是我希望看到的内容:
combination freq
home-gas station-home 472
work-home 439
home-walmart-home 209
另外澄清一下,我现在不需要对这些位置进行任何其他分析,只需要寻找组合分析。
谢谢&如果这是重复的话道歉,但我找不到组合位于多行的任何内容(与许多关于变量/列值组合的示例相比)
答案 0 :(得分:0)
有很多方法 - 我认为罗伯特是正确的要求你概括
我感觉很慷慨 - 所以使用一些生成的数据 - 一些exaples with table和ddply(whihc输出data.frame)
data1 <- data.frame(value=1:100,group=factor(rep(1:4,25)))
table(data1$group)
ddply(data1,.(group),summarize,N=length(group))
ddply(data1,.(group),summarize,N=length(group),sum1=sum(value),mean1=mean(value))