我对R很新,但我鼓励它,因为我觉得它可以访问,虽然我不是程序员。我试图解决以下问题:我需要计算值更改在列中签名的次数,然后按路径对结果进行排序(表格的示例如下 - 路径是一个因素)。我可以想象一下我最终得到它们后如何对数据进行排序,但还没有弄清楚+符号变成次数的计数 - 而且 - 符号变为+ 1。有什么建议吗?
Test <- structure(list(Path = c(1L, 1L, 1L, 2L, 2L, 2L), Direction = c(-3.84089,
-1.12258, 1.47411, -1.47329, 5.4525, 10.161)), .Names = c("Path",
"Direction"), class = "data.frame", row.names = c(NA, -6L))
head(Test)
#> Path Direction
#> 1 1 -3.84089
#> 2 1 -1.12258
#> 3 1 1.47411
#> 4 2 -1.47329
#> 5 2 5.4525
#> 6 2 10.161
答案 0 :(得分:9)
我认为你在寻找的是
sum(diff(sign(X)) != 0)
其中X
是向量,在您的情况下,dat$Direction
您尝试计算符号更改。
Path
计算,可以使用by
函数,或将data.frame
转换为data.table
并使用内置的by
功能。
假设X
是您的原始data.frame
# I'm adding another row to the data, just to show that it works
# (ie, giving the two Path values a different number of rows)
X <- rbind(X, c(2, -5))
# convert to a data.table
library(data.table)
DT <- data.table(X)
# count the number of changes, per path
DT[, changes := sum(diff(sign(Direction)) != 0), by=Path]
factors
):如果Direction
是factor
,则需要先将其转换为numeric
。您可以使用
DT[, Direction := as.numeric(Direction)]
DT
Path Direction changes
1: 1 -3.84089 1
2: 1 -1.12258 1
3: 1 1.47411 1
4: 2 -1.47329 2
5: 2 5.45250 2
6: 2 10.16100 2
7: 2 -5.00000 2
答案 1 :(得分:2)
这是一种使用sign
和rle
的方法,正如贾斯汀建议的那样:
length(rle(sign(Test$Direction))[[1]])
修改强>
起初我可能误会了。也许这更接近你想要的东西:
vals <- tail(rle(sign(Test$Direction))[[-1]], -1)
sum(vals > 0) # neg to pos
sum(vals < 0) # pos to neg