我有一个填充了“交易”和“列”的大型矩阵(超过10,000个行): TransactionDate,已验证("已验证"或NULL),UUID(可多次出现),n_UUID(此UUID有多少次交易),journey_UUID(也可多次出现)和n_journey(此旅程中的交易次数。以下是摘录:
"TransactionDate" "Verified" "UUID" "n_UUID" "journey_UUID" "n_journey"
2014-10-04 23:18:58 "" 247538 118 679237 10
2014-10-04 23:19:04 "" 620831 79 1221991 5
2014-10-04 23:19:05 "" 247538 118 679237 10
2014-10-04 23:19:16 "" 103757 52 377034 1
2014-10-04 23:19:17 "" 23031 177 113316 1
2014-10-04 23:19:25 "VERIFIED" 1539737 1 2195168 1
2014-10-04 23:19:25 "" 1539738 2 2195169 1
2014-10-04 23:19:25 "" 620831 79 1221991 5
2014-10-04 23:19:33 "" 247538 118 679237 10
2014-10-04 23:19:33 "" 1539739 11 2195171 11
2014-10-04 23:19:34 "" 954364 50 1565701 7
2014-10-04 23:19:37 "VERIFIED" 197254 56 575615 1
2014-10-04 23:19:38 "" 1539740 1 2195172 1
2014-10-04 23:19:40 "" 620831 79 1221991 5
2014-10-04 23:19:41 "" 954364 50 1565701 7
2014-10-04 23:19:42 "" 500642 7 1070762 1
2014-10-04 23:19:42 "" 1539741 1 2195173 1
2014-10-04 23:19:43 "" 1539742 1 2195174 1
2014-10-04 23:19:43 "" 23322 162 116724 10
2014-10-04 23:19:45 "" 247538 118 679237 10
2014-10-04 23:19:48 "VERIFIED" 620831 79 1221991 5
2014-10-04 23:19:52 "" 247538 118 679237 10
2014-10-04 23:19:58 "" 481173 55 1047024 1
2014-10-04 23:20:02 "" 620831 79 1221991 5
2014-10-04 23:20:22 "" 1539743 1 2195175 1
2014-10-04 23:20:33 "" 612282 17 1212634 1
2014-10-04 23:20:38 "" 1539739 11 2195171 11
2014-10-04 23:20:40 "" 1539744 2 2195176 1
2014-10-04 23:20:42 "" 1539745 1 2195178 1
2014-10-04 23:20:45 "" 1539746 14 2195179 3
我想知道有多少交易与n_UUID" X"验证,n_journey同样的事情。我还想知道订单是否有影响(通过TransactionDate)。
到目前为止,我通过n_journey(或n_UUID)分割了Matrix:
Journey4 <- (Example[grep("4" , n_journey)])
之后通过TransactionDate和journey_UUID订购它,编号(在这种情况下直到4)并通过这个号码拆分:
Journey4$NR <- 1:(Journey4$n_journey)
GSfirst <- Journey4[grep("\\b1\\b" , NR)]
GSsecond <- Journey4[grep("\\b2\\b" , NR)]
GSthird <- Journey4[grep("\\b3\\b" , NR)]
GSfourth <- Journey4[grep("\\b4\\b" , NR)]
之后,我通过journey_UUID加入了它。 这实际上有效,但它看起来更像是一种解决方法。
问题是它不是真的自动化。每当我想要改变某些东西时,我必须自己更改参数。
我的问题是:是否可以通过UUID自动匹配Matrix?这样,每一行代表一个UUID,并且事务排成一行?
谢谢!
答案 0 :(得分:0)
鉴于您的数据框“df”具有名为:TransactionDate,Verified,UUID,n_UUID,journey_UUID,n_journey的列,您可以通过“已验证”列对df进行子集,如下所示:
df.new <- subset(df, df$Verified == "Verified")
我真的不明白你想做什么:“我也想知道订单是否有影响(通过TransactionDate)。”
希望它至少澄清一些事情