我有一个数据框(df
)。数据框有n列。每列包含数字,不同符号以及一个或多个或非名称(字母字符)。我想获取每个数据帧列的变量名称(这是一个因素)。我使用以下命令从特定列中提取,但它只能部分工作:
str_extract(paste0(df$V3, collapse=""), perl("(?<=\\|)[A-Za-z]+(?=\\|)"))
以下是一些列的示例(df是数据帧,V1 ... Vn是其列)。
> df$V1
[1] MSTV | | | | | | | | MSTV | | | | | | | | | | | | | |
[25] | | | | | |
Levels: | MSTV
> df$V2
[1] MLTV MLTV | | | | | | DP | | | | | | | | | | | | DP
[25] | | | | | |
Levels: | DP MLTV
> df$V3
[1] <= ASTV | | | | ASTV > <= ALTV ALTV | | | | | | | | | | >
[25] DP | | | | DP
Levels: | <= > ALTV ASTV DP
> cleaned.df$V4
[1] 0.4 <= > b b | | 0.4 0 FM | | | | | | | | FM 0 <= UC UC | | >
Levels: | <= > 0 0.4 b FM UC
对于df$V1
,我想得到:MSTV
对于df$V2
,我想得到:DP MLTV
对于df$V3
,我想得到:ALTV ASTV DP
对于df$V4
,我想得到:b FM UC
等等...