如何输出所有级别,长度不等于3?

时间:2015-04-14 12:50:47

标签: r r-factor

我想显示所有级别,长度(character)不等于3个符号。

以下代码返回每行dt$col的长度:

with(dt, nchar(as.character(dt$col)))

但是如果我将levels(dt$col)作为第一个参数传递,则会因以下错误而失败:

  

eval中的错误(substitute(expr),data,enclos = parent.frame()):
  无效' envir'类型'字符'

的参数

如何计算每个级别的长度?如何只显示错误长度的水平?

3 个答案:

答案 0 :(得分:1)

如果您使用的是with,则不应使用dt$,您可以直接引用列名称。

# Some factor data
f <- data.frame(factor = factor(c("ABCD", "ABC", "A", "ABCDE", "ABC")))

# Cont the lengths of the factors
with(f, nchar(as.character(factor)))
[1] 4 3 1 5 3

# Display the levels whose length is not equal to 3
f$factor[with(f, which(nchar(as.character(factor)) !=3)), drop = TRUE]
[1] ABCD  A     ABCDE
Levels: A ABCD ABCDE

答案 1 :(得分:1)

首先,使用您的因子级别创建一个新对象(使用来自DatamineR的答案的数据,除了 NOT ,使用factor作为列名称):

f <- data.frame(myFactor = factor(c("ABCD", "ABC", "A", "ABCDE", "ABC")))
myLevs <- levels(f$myFactor)

然后对不是三个字符的级别进行子集化:

myLevs[nchar(myLevs) != 3]
## [1] "A"     "ABCD"  "ABCDE"

答案 2 :(得分:0)

某些方法可以一行完成:

(l <- levels(f$myFactor))[nchar(l)!=3]
(function(x) x[nchar(x)!=3])(levels(f$myFactor))
levels(f$myFactor) %>% {.[nchar(.)!=3]}  # uses library(magrittr)