使用df [col]访问列给出:'sort.list'的错误'x'必须是原子的

时间:2013-02-08 14:08:53

标签: r vector indexing syntax dataframe

我有一个非常简单的数组,我想在其上运行ROC曲线分析。但首先,当我尝试使用命令table[1]<-factor(table[1])将数据强制转换为因子类型时,我得到错误

Error in sort.list(y) : 'x' must be atomic for 'sort.list'
Have you called 'sort' on a list?

数据中的几个样本行在下面给出

GRADE   TRUE-GRADE

benign  Benign
benign  Benign
benign  Benign
benign  Benign
benign  Benign
benign  Benign
benign  Malignant
benign  Malignant
indeterminate   Benign
indeterminate   Benign
indeterminate   Benign
indeterminate   Benign
indeterminate   Benign
indeterminate   Benign
indeterminate   Benign
indeterminate   Benign
indeterminate   Benign
indeterminate   Benign
indeterminate   Benign
indeterminate   Benign
indeterminate   Benign
indeterminate   Malignant
indeterminate   Malignant
indeterminate   Malignant
likely benign   Benign
likely benign   Benign
likely benign   Benign

有人能告诉我我做错了什么吗? str(表)的结果如下:

data.frame':   127 obs. of  2 variables:
 $ GRADE        : Factor w/ 5 levels "benign","indeterminate",..: 1 1 1 1 1 1 1 1 1 

 $ BENIGN.MALIGN: Factor w/ 2 levels "Benign","Malignant": 1 1 1 1 1 1 1 1 1 1 ...

1 个答案:

答案 0 :(得分:31)

应用于数据帧的函数[返回一个数据帧(如果只使用一个参数)。如果您想访问单个列并将其作为向量返回,则必须改为使用[[

table[1] <- factor(table[[1]])

但这可能没有必要,因为两列都是因素(请参阅str输出)。

顺便说一下:table不是对象的好名字,因为它也是基本R函数的名称。