从数据框中选择数字列和名称指定的一列

时间:2016-02-12 10:36:34

标签: r scale numeric

我有一个包含数字和非数字列的数据框,比如说

df <- data.frame(v1=1:20,v2=1:20,v3=1:20,v4=letters[1:20],v5=letters[1:20])

要仅选择我将使用的非数字列

fixCol <- !sapply(df,is.numeric)

但是现在我还想要包含一个特定的数字列,比如说v2。我的数据框非常大,列的顺序也发生了变化,因此我无法使用数字对其进行索引,我真的想使用名称&#39; v2&#39;。我试过了

fixCol$v2 = TRUE

但是这给了我警告In fixCol$FR = TRUE : Coercing LHS to a list,这使我无法将原始数据框子化为仅获得fixCol

df[,fixCol]

给出:Error in .subset(x, j) : invalid subscript type 'list'

最后我的目标是缩放我的数据框的所有数字列,除了这一个指定的列,使用类似的东西

scaleCol = !fixCol
df_scaled = cbind(df[,fixCol], sapply(df[,scaleCol],scale))

我怎样才能做到最好?

2 个答案:

答案 0 :(得分:3)

我们可以使用OR条件(|)来获取逻辑索引,然后对'df'列进行子集化。

df1 <- df[!sapply(df, is.numeric)|names(df)=='v2']
head(df1,2)
#  v2 v4 v5
#1  1  a  a
#2  2  b  b

答案 1 :(得分:2)

fixCol <- !sapply(df,is.numeric)
fixCol <- df[, fixCol]
fixCol$v2 <- df[colnames(df)=="v2"]
head(fixCol)
 # v4 v5 v2
#1  a  a  1
#2  b  b  2
#3  c  c  3
#4  d  d  4
#5  e  e  5
#6  f  f  6