使用R中的apply()时出现未使用的参数错误

时间:2013-08-13 22:44:54

标签: r regression

当我尝试在日期列上使用apply()条件返回一组系数时,我收到一条错误消息。

我有一个数据集(为简单起见,此处进行了修改,但可重现):

ADataset <- data.table(Epoch = c("2007-11-15", "2007-11-16", "2007-11-17", 
                       "2007-11-18", "2007-11-19", "2007-11-20", "2007-11-21"),
                       Distance = c("92336.22", "92336.23", "92336.22", "92336.20",
                       "92336.19", "92336.21", "92336.18))
ADataset
        Epoch Distance
1: 2007-11-15 92336.22
2: 2007-11-16 92336.23
3: 2007-11-17 92336.22
4: 2007-11-18 92336.20
5: 2007-11-19 92336.19
6: 2007-11-20 92336.21
7: 2007-11-21 92336.18

分析从建立开始和结束日期开始:

############## Establish dates for analysis
#4.Set date for center of duration
StartDate <- "2007-11-18"
as.numeric(as.Date(StartDate)); StartDate
EndDate <- as.Date(tail(Adataset$Epoch,1)); EndDate

然后我建立分析的持续时间:

#5.Quantify duration of time window
STDuration <-  1
LTDuration  <- 3

然后我编写函数来对两个持续时间进行回归并返回斜率:

# Write STS and LTS functions, each with following steps
#6.Define time window- from StartDate less ShortTermDuration to 
StartDate plus ShortTermDuration
#7.Define Short Term & Long Term datasets
#8. Run regression over dataset
my_STS_Function <- function (StartDate) {

  STAhead  <- as.Date(StartDate) + STDuration; STAhead
  STBehind <- as.Date(StartDate) - STDuration; STBehind
  STDataset  <- subset(Adataset, as.Date(Epoch) >= STBehind & as.Date(Epoch)<STAhead)
  STResults <- rlm( Distance ~ Epoch, data=STDataset); STResults
  STSummary <- summary( STResults ); STSummary
  # Return coefficient (Slope of regression)
  STNum <- STResults$coefficients[2];STNum
}
my_LTS_Function <- function (StartDate) {
  LTAhead  <- as.Date(StartDate) + LTDuration; LTAhead
  LTBehind <- as.Date(StartDate) - LTDuration; LTBehind
  LTDataset  <- subset(Adataset, as.Date(Epoch) >= LTBehind & as.Date(Epoch)<LTAhead)
  LTResults <- rlm( Distance ~ Epoch, data=LTDataset); LTResults
  LTSummary <- summary( LTResults ); LTSummary
  # Return coefficient (Slope of regression)
  LTNum <- LTResults$coefficients[2];LTNum

然后我测试函数以确保它适用于单个日期:

myTestResult <- my_STS_Function("2007-11-18")

它有效,所以我继续在数据集中的日期范围内应用该函数:

mySTSResult <- apply(Adataset, 1, my_STS_Function, seq(StartDate : EndDate))

...其中我想要的结果是mySTSResult(斜率)的列表或数组或向量(以及随后的myLTSResults的单独列表/数组/向量,因此我可以在持续时间内创建STSlope:LTSlope比率),像(mySTSResults made)...

> Adataset
    Epoch Distance mySTSResults
1: 2007-11-15 92336.22            3
2: 2007-11-16 92336.23            4
3: 2007-11-17 92336.22            5
4: 2007-11-18 92336.20            6
5: 2007-11-19 92336.19            7
6: 2007-11-20 92336.21            8
7: 2007-11-21 92336.18            9

只有我收到此错误:

Error in FUN(newX[, i], ...) : unused argument(s) (1:1185)

这告诉我什么以及如何纠正它?我做了一些看,但找不到修正。

希望我已经充分解释了这一点。如果您需要更多详细信息,请与我们联系。

2 个答案:

答案 0 :(得分:0)

好的,似乎问题出现在my_STS_Function函数调用中所述的apply的附加参数中(因为您只用一个参数定义了它)。日期范围作为该函数的附加参数传递,R抱怨它未被使用(看起来是1185个元素的向量)。您是否正在尝试拉出受日期范围首先限制的行的子集,然后是否希望应用my_STS_Function?我必须考虑一下这个问题的确切解决方案。

抱歉 - 我在那里的评论中做了我的工作。一个可能的解决方案是:

subSet <- Adataset[Adataset[,1] %in% seq(StartDate:EndDate),][order(na.exclude(match(Adataset[,1], seq(StartData,EndDate))),]

改编自这个问题的答案:

R select rows in matrix from another vector (match, %in)

答案 1 :(得分:0)

将此作为新答案添加,因为之前的答案感到困惑。以前的评论者是正确的,你的代码中有错误,但它们不是一个棘手的问题。

我更新的方法是使用seq.Date生成日期序列(仅当您在开始和结束之间每天都有一个数据点时才有效 - 尽管您可以使用上面的na.exclude):

dates = seq.Date(as.Date(StartDate),as.Date(EndDate),"days")

然后使用它作为应用的输入,使用一些类型来使事情正常工作(我用lamda函数完成了这个):

mySTSResult <- apply(as.matrix(dates), 1, function(x) {class(x) <- "Date"; my_STS_Function(x)})

然后希望你应该有一个结果的向量,你应该能够为LTS做类似的事情,然后将其操作到原始数据框/矩阵中的另一列。