我正在使用数据框,我需要提取数据如下:
我有以下数据框。
a = c(1:40)
b = c(41:80)
c = c(81:120)
d = c('a','b','c','d','e')
e = NA
f = NA
g = NA
df = cbind.data.frame(a,b,c,d,e,f,g)
names(df) = c('1m','2m','3m','reg','1m_comp','2m_comp','3m_comp')
1m 2m 3m reg 1m_comp 2 m_comp 3m_comp
1 41 81 a NA NA NA
2 42 82 b NA NA NA
3 43 83 c NA NA NA
4 44 84 d NA NA NA
5 45 85 e NA NA NA
6 46 86 a NA NA NA
如果'reg'列具有特定值,我会在函数内使用'1'','2m'列中的值填充'comp'列。
我这样做:
df = within(df, {
1m[reg=='a'] <- 1m_comp[reg=='a']
2m[reg=='a'] <- 2m_comp[reg=='a']
3m[reg=='a'] <- 3m_comp[reg=='a']})
我正在处理的数据框有46 + 46个这样的列(列和comps)。我尝试了
,而不是编写46行代码df = within(df, {
for (i in 1:46) {
str_c(i,'m_comp')[reg=='a'] = str_c(i,'m')[reg=='a']}})
但是,我的数据框架没有变化。我也没有看到任何错误。
编辑:现在解决了!谢谢d.b。
答案 0 :(得分:1)
如果您不想对所有列名进行硬编码,可以使用类似的名称。
comp.cols <- colnames(df)[grepl("_comp", colnames(df)) == TRUE]
non.comp.cols <- sub("_comp", "", comp.cols)
df[df[,"reg"] == "a", comp.cols] <- df[df[,"reg"] == "a", non.comp.cols]