如何从数据帧因子中获取字母串

时间:2015-08-25 14:22:18

标签: r dataframe

我有一个数据框(df)。数据框有n列。每列包含数字,不同符号以及一个或多个或非名称(字母字符)。我想获取每个数据帧列的变量名称(这是一个因素)。我使用以下命令从特定列中提取,但它只能部分工作:

str_extract(paste0(df$V3, collapse=""), perl("(?<=\\|)[A-Za-z]+(?=\\|)"))

以下是一些列的示例(df是数据帧,V1 ... Vn是其列)。

> df$V1
 [1] MSTV |    |    |    |    |    |    |    |    MSTV |    |    |    |    |    |    |    |    |    |    |    |    |    |   
[25] |    |    |    |    |    |   
Levels: | MSTV
> df$V2
 [1]      MLTV MLTV |    |    |    |    |    |         DP   |    |    |    |    |    |    |    |    |    |    |    |    DP  
[25] |    |    |    |    |    |   
Levels:  | DP MLTV
> df$V3
 [1] <=             ASTV |    |    |    |    ASTV >    <=   ALTV ALTV |    |    |    |    |    |    |    |    |    |    >   
[25] DP   |    |    |    |    DP  
Levels:  | <= > ALTV ASTV DP
> cleaned.df$V4
 [1] 0.4 <=  >       b   b   |   |       0.4 0           FM  |   |   |   |   |   |   |   |   FM  0   <=  UC  UC  |   |   >  
Levels:  | <= > 0 0.4 b FM UC

对于df$V1,我想得到:MSTV 对于df$V2,我想得到:DP MLTV 对于df$V3,我想得到:ALTV ASTV DP 对于df$V4,我想得到:b FM UC 等等...

0 个答案:

没有答案