长篇大论道歉!我是R的新手,一直在努力提高我对语言的掌握。我偶然发现了这个关于足球成绩建模的有趣项目:http://www1.maths.leeds.ac.uk/~voss/projects/2010-sports/JamesGardner.pdf
当我运行代码模拟一个完整的季节时,我一直遇到问题(首先提到第36页,附录第59页):
Games <- function(parameters)
{
teams <- rownames(parameters)
P <- parameters$teams
home <- parameters$home
n <- length(teams)
C <- data.frame()
row <- 1
for (i in 1:n) {
for (j in 1:n) {
if (i != j) {
C[row,1] <- teams[i]
C[row,2] <- teams[j]
C[row,3] <- rpois(1, exp(P[i,]$Attack - P[j,]$Defence + home))
C[row,4] <- rpois(1, exp(P[j,]$Attack - P[i,]$Defence))
row <- row + 1
}
}
}
return(C)
}
Games(TeamParameters)
我得到的回应是
Error in `*tmp*`[[j]] : subscript out of bounds
当我尝试追溯()时,这就是我得到的:
3: `[<-.data.frame`(`*tmp*`, row, 1, value = NULL) at #11
2: `[<-`(`*tmp*`, row, 1, value = NULL) at #11
1: Games(TeamParameters)
我真的不明白错误的含义,我将不胜感激。再一次,为长篇文章道歉,但我真的对这个项目感兴趣,并希望了解问题所在!
答案 0 :(得分:4)
data.frame对象不能通过[<-.data.frame
操作按行扩展。 (您需要使用rbind
。)您应该创建一个具有足够空间的对象,可以是预尺寸矩阵或data.frame。如果“C”是0行的对象,则尝试分配给第一行将失败。有一个名为“C”的函数,因此您可能希望使其名称更加清晰。似乎还有比双循环更有效的方法,但你没有很好地描述参数对象。
您可能会注意到您引用的那篇论文的附录显示了如何预先确定数据框的维度:
teams <- sort(unique(c(games[,1], games[,2])), decreasing = FALSE)
T <- data.frame(Team=teams, ... )
...假设游戏对象已经具有适当的行数,并且计算结果分配了新的列值。如果该引用列没有当前值,则$<-
操作将成功。