Question

给出这样的数据框：

 DL<-c("Dark52","Light-298","dark7","23_dark","The_light","Lights","77dark","9Light")
 Col1<-c(1,12,3,6,4,8,2,8)
 DF<-data.frame(Col1)
 row.names(DF)<-DL

如何创建包含行名称的“Dark”或“Light”元素的第二列？

所以最终结果看起来像这样

Col2<-c("Dark","Light","dark","dark","light","Light","dark","Light")
DF$Col2<-Col2


          Col1  Col2
Dark52       1  Dark
Light-298   12 Light
dark7        3  dark
23_dark      6  dark
The_light    4 light
Lights       8 Light
77dark       2  dark
9Light       8 Light

Answer 1

使用正则表达式：

x <- gsub("[^a-zA-Z]", "", row.names(DF))
DF$Col2 <- "dark"
DF$Col2[agrep("light", x)] <- "light"

          Col1  Col2
Dark52       1  dark
Light-298   12 light
dark7        3  dark
23_dark      6  dark
The_light    4 light
Lights       8 light
77dark       2  dark
9Light       8 light

PS：准备gsub("[^dark|light]", "", row.names(DF), ignore.case = TRUE)，但The_light失败。

Answer 2

这是一种方法，但也许有一种更直接的方法：D

> transform(DF, 
+           Col2=sapply(strsplit(tolower(gsub("[0-9]", "", rownames(DF))), "[[:punct:]]"), 
+                       function(x) x[x%in% c("dark", "light", "lights")]))
          Col1   Col2
Dark52       1   dark
Light-298   12  light
dark7        3   dark
23_dark      6   dark
The_light    4  light
Lights       8 lights
77dark       2   dark
9Light       8  light

从单独列的单词元素创建列

2 个答案: