匹配一个矩阵

时间:2015-12-22 10:49:55

标签: r matrix match

我有一个填充了“交易”和“列”的大型矩阵(超过10,000个行): TransactionDate,已验证("已验证"或NULL),UUID(可多次出现),n_UUID(此UUID有多少次交易),journey_UUID(也可多次出现)和n_journey(此旅程中的交易次数。以下是摘录:

"TransactionDate" "Verified" "UUID" "n_UUID" "journey_UUID" "n_journey"
2014-10-04 23:18:58     ""     247538     118     679237     10
2014-10-04 23:19:04     ""     620831     79     1221991     5
2014-10-04 23:19:05     ""     247538     118     679237     10
2014-10-04 23:19:16     ""     103757     52     377034     1
2014-10-04 23:19:17     ""     23031     177     113316     1
2014-10-04 23:19:25     "VERIFIED"     1539737     1     2195168     1
2014-10-04 23:19:25     ""     1539738     2     2195169     1
2014-10-04 23:19:25     ""     620831     79     1221991     5
2014-10-04 23:19:33     ""     247538     118     679237     10
2014-10-04 23:19:33     ""     1539739     11     2195171     11
2014-10-04 23:19:34     ""     954364     50     1565701     7
2014-10-04 23:19:37     "VERIFIED"     197254     56     575615     1
2014-10-04 23:19:38     ""     1539740     1     2195172     1
2014-10-04 23:19:40     ""     620831     79     1221991     5
2014-10-04 23:19:41     ""     954364     50     1565701     7
2014-10-04 23:19:42     ""     500642     7     1070762     1
2014-10-04 23:19:42     ""     1539741     1     2195173     1
2014-10-04 23:19:43     ""     1539742     1     2195174     1
2014-10-04 23:19:43     ""     23322     162     116724     10
2014-10-04 23:19:45     ""     247538     118     679237     10
2014-10-04 23:19:48     "VERIFIED"     620831     79     1221991     5
2014-10-04 23:19:52     ""     247538     118     679237     10
2014-10-04 23:19:58     ""     481173     55     1047024     1
2014-10-04 23:20:02     ""     620831     79     1221991     5
2014-10-04 23:20:22     ""     1539743     1     2195175     1
2014-10-04 23:20:33     ""     612282     17     1212634     1
2014-10-04 23:20:38     ""     1539739     11     2195171     11
2014-10-04 23:20:40     ""     1539744     2     2195176     1
2014-10-04 23:20:42     ""     1539745     1     2195178     1
2014-10-04 23:20:45     ""     1539746     14     2195179     3

我想知道有多少交易与n_UUID" X"验证,n_journey同样的事情。我还想知道订单是否有影响(通过TransactionDate)。

到目前为止,我通过n_journey(或n_UUID)分割了Matrix:

Journey4 <- (Example[grep("4" , n_journey)])

之后通过TransactionDate和journey_UUID订购它,编号(在这种情况下直到4)并通过这个号码拆分:

Journey4$NR <- 1:(Journey4$n_journey)
GSfirst <- Journey4[grep("\\b1\\b" , NR)]
GSsecond  <- Journey4[grep("\\b2\\b" , NR)]
GSthird <- Journey4[grep("\\b3\\b" , NR)]
GSfourth  <- Journey4[grep("\\b4\\b" , NR)]

之后,我通过journey_UUID加入了它。 这实际上有效,但它看起来更像是一种解决方法。

问题是它不是真的自动化。每当我想要改变某些东西时,我必须自己更改参数。

我的问题是:是否可以通过UUID自动匹配Matrix?这样,每一行代表一个UUID,并且事务排成一行?

谢谢!

1 个答案:

答案 0 :(得分:0)

鉴于您的数据框“df”具有名为:TransactionDate,Verified,UUID,n_UUID,journey_UUID,n_journey的列,您可以通过“已验证”列对df进行子集,如下所示:

df.new <- subset(df, df$Verified == "Verified")

我真的不明白你想做什么:“我也想知道订单是否有影响(通过TransactionDate)。”

希望它至少澄清一些事情