Question

我有一个填充了“交易”和“列”的大型矩阵（超过10,000个行）： TransactionDate，已验证（＆＃34;已验证＆＃34;或NULL），UUID（可多次出现），n_UUID（此UUID有多少次交易），journey_UUID（也可多次出现）和n_journey（此旅程中的交易次数。以下是摘录：

"TransactionDate" "Verified" "UUID" "n_UUID" "journey_UUID" "n_journey"
2014-10-04 23:18:58     ""     247538     118     679237     10
2014-10-04 23:19:04     ""     620831     79     1221991     5
2014-10-04 23:19:05     ""     247538     118     679237     10
2014-10-04 23:19:16     ""     103757     52     377034     1
2014-10-04 23:19:17     ""     23031     177     113316     1
2014-10-04 23:19:25     "VERIFIED"     1539737     1     2195168     1
2014-10-04 23:19:25     ""     1539738     2     2195169     1
2014-10-04 23:19:25     ""     620831     79     1221991     5
2014-10-04 23:19:33     ""     247538     118     679237     10
2014-10-04 23:19:33     ""     1539739     11     2195171     11
2014-10-04 23:19:34     ""     954364     50     1565701     7
2014-10-04 23:19:37     "VERIFIED"     197254     56     575615     1
2014-10-04 23:19:38     ""     1539740     1     2195172     1
2014-10-04 23:19:40     ""     620831     79     1221991     5
2014-10-04 23:19:41     ""     954364     50     1565701     7
2014-10-04 23:19:42     ""     500642     7     1070762     1
2014-10-04 23:19:42     ""     1539741     1     2195173     1
2014-10-04 23:19:43     ""     1539742     1     2195174     1
2014-10-04 23:19:43     ""     23322     162     116724     10
2014-10-04 23:19:45     ""     247538     118     679237     10
2014-10-04 23:19:48     "VERIFIED"     620831     79     1221991     5
2014-10-04 23:19:52     ""     247538     118     679237     10
2014-10-04 23:19:58     ""     481173     55     1047024     1
2014-10-04 23:20:02     ""     620831     79     1221991     5
2014-10-04 23:20:22     ""     1539743     1     2195175     1
2014-10-04 23:20:33     ""     612282     17     1212634     1
2014-10-04 23:20:38     ""     1539739     11     2195171     11
2014-10-04 23:20:40     ""     1539744     2     2195176     1
2014-10-04 23:20:42     ""     1539745     1     2195178     1
2014-10-04 23:20:45     ""     1539746     14     2195179     3

我想知道有多少交易与n_UUID＆＃34; X＆＃34;验证，n_journey同样的事情。我还想知道订单是否有影响（通过TransactionDate）。

到目前为止，我通过n_journey（或n_UUID）分割了Matrix：

Journey4 <- (Example[grep("4" , n_journey)])

之后通过TransactionDate和journey_UUID订购它，编号（在这种情况下直到4）并通过这个号码拆分：

Journey4$NR <- 1:(Journey4$n_journey)
GSfirst <- Journey4[grep("\\b1\\b" , NR)]
GSsecond  <- Journey4[grep("\\b2\\b" , NR)]
GSthird <- Journey4[grep("\\b3\\b" , NR)]
GSfourth  <- Journey4[grep("\\b4\\b" , NR)]

之后，我通过journey_UUID加入了它。这实际上有效，但它看起来更像是一种解决方法。

问题是它不是真的自动化。每当我想要改变某些东西时，我必须自己更改参数。

我的问题是：是否可以通过UUID自动匹配Matrix？这样，每一行代表一个UUID，并且事务排成一行？

谢谢！

Answer 1

鉴于您的数据框“df”具有名为：TransactionDate，Verified，UUID，n_UUID，journey_UUID，n_journey的列，您可以通过“已验证”列对df进行子集，如下所示：

df.new <- subset(df, df$Verified == "Verified")

我真的不明白你想做什么：“我也想知道订单是否有影响（通过TransactionDate）。”

希望它至少澄清一些事情

匹配一个矩阵

1 个答案: