基于某些转化标准的数据转换

时间:2016-03-24 10:09:54

标签: r

我想根据特定条件转换数据集。这些条件在另一个数据集中给出。让我用一个例子解释一下。

假设我使用以下格式的数据集:

Date       Var1 Var2
3/1/2016    8   14
3/2/2016    7   8
3/3/2016    7   6
3/4/2016    10  8
3/5/2016    5   10
3/6/2016    9   15
3/7/2016    2   5
3/8/2016    6   14
3/9/2016    8   15
3/10/2016   8   8

以下数据集具有转换条件,格式如下:

Variable    Trans1  Trans2
  Var1       1||2   0.5||0.7
  Var2       1||2   0.3||0.8

现在,我想从Var1,1.0.5的转换表中提取第一个条件,并将1加到Var1并将其乘以0.5。我将对var2做同样的事情,加1并乘以0.3。此转换将为我提供新变量Var1_1和var2_1。我会为另一个转换做同样的事情,它会给我Var1_2和Var2_2。对于Var1_2,变换是Var1和2并乘以0.7。

转换后,数据集将如下所示:

  Date     Var1 Var2    Var1_1  Var2_1  Var1_2  Var2_2
3/1/2016    8   14       4.5     4.5      7      11.2
3/2/2016    7   8        4       2.7      6.3     7
3/3/2016    7   6        4       2.1      6.3     5.6
3/4/2016    10  8        5.5     2.7      8.4     7
3/5/2016    5   10       3       3.3      4.9     8.4
3/6/2016    9   15       5       4.8      7.7    11.9
3/7/2016    2   5        1.5     1.8      2.8     4.9
3/8/2016    6   14       3.5     4.5      5.6    11.2
3/9/2016    8   15       4.5     4.8      7      11.9
3/10/2016   8   8        4.5     2.7      7       7

1 个答案:

答案 0 :(得分:2)

假设您的原始data.frame被称为df并且您的条件表cond1,那么我们可以创建自定义函数,

funV1Cond1 <- function(x){
  t1 <- as.numeric(gsub("[||].*", "", cond1$Trans1[cond1$Variable == "Var1"]))
  t2 <- as.numeric(gsub("[||].*", "", cond1$Trans2[cond1$Variable == "Var1"]))
  result <- (x$Var1 + t1)*t2
  return(result)
}
funV1Cond1(df)
 #[1] 4.5 4.0 4.0 5.5 3.0 5.0 1.5 3.5 4.5 4.5

与功能2相同

funV1Cond2 <- function(x){
  t1 <- as.numeric(gsub(".*[||]", "", cond1$Trans1[cond1$Variable == "Var1"]))
  t2 <- as.numeric(gsub(".*[||]", "", cond1$Trans2[cond1$Variable == "Var1"]))
  result <- (x$Var1 + t1)*t2
  return(result)
}
funV1Cond2(df)
 #[1] 7.0 6.3 6.3 8.4 4.9 7.7 2.8 5.6 7.0 7.0

假设Trans1列有3个条件,即1, 2, 3,那么,

as.numeric(sapply(str_split(cond1$Trans1[cond1$Variable == "Var1"], ','),function(x) x[2]))
#[1] 2
as.numeric(sapply(str_split(cond1$Trans1[cond1$Variable == "Var1"], ','),function(x) x[1]))
#[1] 1
as.numeric(sapply(str_split(cond1$Trans1[cond1$Variable == "Var1"], ','),function(x) x[3]))
#[1] 3

请注意,我将分隔符更改为','