R正在返回不在数据框中的ID?

时间:2014-10-06 21:09:00

标签: r

我有一个数据框,其中包含几个代表ID号的变量(工作空间中的数据帧最初都是来自规范化数据库的表)。我很惊讶地发现,在使用合并来映射描述之前,我有时能够引用ID的描述,但前提是我使用$符号。例如:我设置数据帧q以包含变量“LocationID”。然后我做了以下......

1& 2:

> colnames(q)
[1] "LocationID" "PlanID"     "Rate"      

> sort(unique(q[,'Location')) #This fails. duh
Error in `[.data.frame`(q, , "Location") : undefined columns selected

> sort(unique(q$Location)) #This works. what?
[1]  1  2  3

问题

  1. 为什么第二个有效?也许那是在寻找一匹礼物马。
  2. 如果第一个出现问题,为什么第一个不起作用?
  3. 对于上面的例子,q是由另一个数据框构成的 变量。对于较大的数据帧,这会失败。为什么会失败?
  4. 3的示例:

    > dim(y)
    [1] 207171     86
    
    q<-y[,cbind('LocationID','PlanID','Rate')]
    
    > dim(q)
    [1] 207171      3
    
    > unique(y$Location)
    NULL
    
    > unique(q$Location)
    [1]  1  2  3
    

0 个答案:

没有答案