访问dataframe列会导致sort.list(y)出错:'x'必须是'sort.list'的原子

时间:2013-04-24 18:50:01

标签: r vector indexing dataframe

目前我正在尝试使用knnMCN()

我是以这种格式做的......

knnMCN(data, classification, data2, K=1, ShowObs=T)

文件数据,分类和数据2都是.csv文件。 'data'是我的训练数据,'分类'是分类的单列文件(分类为0,1或2),data2是我想要分类的数据集。

这些文件中只有数值。每当我运行此命令时,我都会收到错误:

Error in sort.list(y) : 'x' must be atomic for 'sort.list'
Have you called 'sort' on a list?

有人知道这里出了什么问题吗? K-Nearest Neighbors有更好/不同的方式吗?

编辑:这些是dput(head(data / classification / data2))

的结果

数据:

structure(list(down = c(1L, 2L, 3L, 1L, 2L, 1L), yards_to_first = c(10L, 
7L, 7L, 10L, 7L, 10L), yards_to_endzone = c(84L, 81L, 81L, 73L, 
70L, 40L), score_difference = c(0L, 0L, 0L, 0L, 0L, 0L), quarter = c(1L, 
1L, 1L, 1L, 1L, 1L), seconds_remaining = c(3595L, 3560L, 3554L, 
3523L, 3476L, 3450L)), .Names = c("down", "yards_to_first", "yards_to_endzone", 
"score_difference", "quarter", "seconds_remaining"), row.names = c(NA, 
6L), class = "data.frame")

分类

structure(list(play_type = c(0L, 1L, 1L, 0L, 1L, 1L)), .Names = "play_type",
row.names = c(NA,6L), class = "data.frame")

DATA2:

structure(list(down = c(1L, 2L, 3L, 4L, 1L, 2L), yards_to_first = c(10L, 
5L, 8L, 8L, 10L, 10L), yards_to_endzone = c(58L, 53L, 56L, 56L, 
98L, 98L), score_difference = c(0L, 0L, 0L, 0L, 0L, 0L), quarter = c(1L, 
1L, 1L, 1L, 1L, 1L), seconds_remaining = c(3593L, 3556L, 3515L, 
3507L, 3496L, 3460L)), .Names = c("down", "yards_to_first", "yards_to_endzone", 
"score_difference", "quarter", "seconds_remaining"), row.names = c(NA, 
6L), class = "data.frame")

1 个答案:

答案 0 :(得分:4)

将分类作为向量而不是作为具有一列的数据框传递:

knnMCN(data, classification$play_type, data2, K=1, ShowObs=T)

说明:虽然knnMCN的文档说分类应该是“矩阵或数据框”,但这似乎是错误的,因为函数的代码试图将分类视为向量。抛出错误的行是:

OrigTrnG = as.factor(OrigTrnG)

因为as.factor无法在数据框上使用。