我想显示所有级别,长度(character
)不等于3个符号。
以下代码返回每行dt$col
的长度:
with(dt, nchar(as.character(dt$col)))
但是如果我将levels(dt$col)
作为第一个参数传递,则会因以下错误而失败:
eval中的错误(substitute(expr),data,enclos = parent.frame()):
的参数
无效' envir'类型'字符'
如何计算每个级别的长度?如何只显示错误长度的水平?
答案 0 :(得分:1)
如果您使用的是with
,则不应使用dt$
,您可以直接引用列名称。
# Some factor data
f <- data.frame(factor = factor(c("ABCD", "ABC", "A", "ABCDE", "ABC")))
# Cont the lengths of the factors
with(f, nchar(as.character(factor)))
[1] 4 3 1 5 3
# Display the levels whose length is not equal to 3
f$factor[with(f, which(nchar(as.character(factor)) !=3)), drop = TRUE]
[1] ABCD A ABCDE
Levels: A ABCD ABCDE
答案 1 :(得分:1)
首先,使用您的因子级别创建一个新对象(使用来自DatamineR的答案的数据,除了 NOT ,使用factor
作为列名称):
f <- data.frame(myFactor = factor(c("ABCD", "ABC", "A", "ABCDE", "ABC")))
myLevs <- levels(f$myFactor)
然后对不是三个字符的级别进行子集化:
myLevs[nchar(myLevs) != 3]
## [1] "A" "ABCD" "ABCDE"
答案 2 :(得分:0)
某些方法可以一行完成:
(l <- levels(f$myFactor))[nchar(l)!=3]
(function(x) x[nchar(x)!=3])(levels(f$myFactor))
levels(f$myFactor) %>% {.[nchar(.)!=3]} # uses library(magrittr)