当我尝试在日期列上使用apply()条件返回一组系数时,我收到一条错误消息。
我有一个数据集(为简单起见,此处进行了修改,但可重现):
ADataset <- data.table(Epoch = c("2007-11-15", "2007-11-16", "2007-11-17",
"2007-11-18", "2007-11-19", "2007-11-20", "2007-11-21"),
Distance = c("92336.22", "92336.23", "92336.22", "92336.20",
"92336.19", "92336.21", "92336.18))
ADataset
Epoch Distance
1: 2007-11-15 92336.22
2: 2007-11-16 92336.23
3: 2007-11-17 92336.22
4: 2007-11-18 92336.20
5: 2007-11-19 92336.19
6: 2007-11-20 92336.21
7: 2007-11-21 92336.18
分析从建立开始和结束日期开始:
############## Establish dates for analysis
#4.Set date for center of duration
StartDate <- "2007-11-18"
as.numeric(as.Date(StartDate)); StartDate
EndDate <- as.Date(tail(Adataset$Epoch,1)); EndDate
然后我建立分析的持续时间:
#5.Quantify duration of time window
STDuration <- 1
LTDuration <- 3
然后我编写函数来对两个持续时间进行回归并返回斜率:
# Write STS and LTS functions, each with following steps
#6.Define time window- from StartDate less ShortTermDuration to
StartDate plus ShortTermDuration
#7.Define Short Term & Long Term datasets
#8. Run regression over dataset
my_STS_Function <- function (StartDate) {
STAhead <- as.Date(StartDate) + STDuration; STAhead
STBehind <- as.Date(StartDate) - STDuration; STBehind
STDataset <- subset(Adataset, as.Date(Epoch) >= STBehind & as.Date(Epoch)<STAhead)
STResults <- rlm( Distance ~ Epoch, data=STDataset); STResults
STSummary <- summary( STResults ); STSummary
# Return coefficient (Slope of regression)
STNum <- STResults$coefficients[2];STNum
}
my_LTS_Function <- function (StartDate) {
LTAhead <- as.Date(StartDate) + LTDuration; LTAhead
LTBehind <- as.Date(StartDate) - LTDuration; LTBehind
LTDataset <- subset(Adataset, as.Date(Epoch) >= LTBehind & as.Date(Epoch)<LTAhead)
LTResults <- rlm( Distance ~ Epoch, data=LTDataset); LTResults
LTSummary <- summary( LTResults ); LTSummary
# Return coefficient (Slope of regression)
LTNum <- LTResults$coefficients[2];LTNum
然后我测试函数以确保它适用于单个日期:
myTestResult <- my_STS_Function("2007-11-18")
它有效,所以我继续在数据集中的日期范围内应用该函数:
mySTSResult <- apply(Adataset, 1, my_STS_Function, seq(StartDate : EndDate))
...其中我想要的结果是mySTSResult(斜率)的列表或数组或向量(以及随后的myLTSResults的单独列表/数组/向量,因此我可以在持续时间内创建STSlope:LTSlope比率),像(mySTSResults made)...
> Adataset
Epoch Distance mySTSResults
1: 2007-11-15 92336.22 3
2: 2007-11-16 92336.23 4
3: 2007-11-17 92336.22 5
4: 2007-11-18 92336.20 6
5: 2007-11-19 92336.19 7
6: 2007-11-20 92336.21 8
7: 2007-11-21 92336.18 9
只有我收到此错误:
Error in FUN(newX[, i], ...) : unused argument(s) (1:1185)
这告诉我什么以及如何纠正它?我做了一些看,但找不到修正。
希望我已经充分解释了这一点。如果您需要更多详细信息,请与我们联系。
答案 0 :(得分:0)
好的,似乎问题出现在my_STS_Function
函数调用中所述的apply
的附加参数中(因为您只用一个参数定义了它)。日期范围作为该函数的附加参数传递,R抱怨它未被使用(看起来是1185个元素的向量)。您是否正在尝试拉出受日期范围首先限制的行的子集,然后是否希望应用my_STS_Function
?我必须考虑一下这个问题的确切解决方案。
抱歉 - 我在那里的评论中做了我的工作。一个可能的解决方案是:
subSet <- Adataset[Adataset[,1] %in% seq(StartDate:EndDate),][order(na.exclude(match(Adataset[,1], seq(StartData,EndDate))),]
改编自这个问题的答案:
答案 1 :(得分:0)
将此作为新答案添加,因为之前的答案感到困惑。以前的评论者是正确的,你的代码中有错误,但它们不是一个棘手的问题。
我更新的方法是使用seq.Date生成日期序列(仅当您在开始和结束之间每天都有一个数据点时才有效 - 尽管您可以使用上面的na.exclude):
dates = seq.Date(as.Date(StartDate),as.Date(EndDate),"days")
然后使用它作为应用的输入,使用一些类型来使事情正常工作(我用lamda函数完成了这个):
mySTSResult <- apply(as.matrix(dates), 1, function(x) {class(x) <- "Date"; my_STS_Function(x)})
然后希望你应该有一个结果的向量,你应该能够为LTS做类似的事情,然后将其操作到原始数据框/矩阵中的另一列。