我的数据如下:
data.frame(name=c("city","village"),code=c(10322,10321),plz=c(7041,7043),plz1=c(7044,7044),plz2=c(7043,NA))
将列 plz1 和列 plz2 转换为plz的最明智的方法是什么:
name code plz
city 10322 7041
city 10322 7044
city 10322 7043
答案 0 :(得分:0)
首先我们melt
,将所有plz
值放入一列(从"宽"到" long"格式)。然后我们只删除"变量"专栏,因为我们不需要区分plz
和plz1
,我们会将value
重命名为plz
。
require(reshape2)
df1 <- data.frame(name=c("city","village"),code=c(10322,10321),plz=c(7041,7043),plz1=c(7044,7044),plz2=c(7043,NA))
df1 <- melt(df1, id.vars=c("name", "code"))
df1 <- df1[,-3]
names(df1) <- c("name", "code", "plz")
name code plz
1 city 10322 7041
2 village 10321 7043
3 city 10322 7044
4 village 10321 7044
5 city 10322 7043
6 village 10321 NA
我们可以进一步简化dplyr
包:
require(dplyr)
require(reshape2)
df1 %>% melt(id.vars=c("name", "code")) %>%
select(-variable) %>%
rename(plz=value)
答案 1 :(得分:0)
使用tidyr和dplyr包。
df <- data.frame(name=c("city","village"),code=c(10322,10321), plz=c(7041,7043),plz1=c(7044,7044),plz2=c(7043,NA))
df %>% tidyr::gather(type, plz, plz:plz2) %>% dplyr::select(-type) %>% dplyr::filter(name == 'city')
#name code plz
#city 10322 7041
#city 10322 7044
#city 10322 7043