如何从多个表中计算变量以生成新列?

时间:2019-02-25 05:02:12

标签: r dataframe data-analysis calculated-columns

我有两个数据集,如下所示。 (它是由示例数据制成的。)

enter image description here

现在,我想从两个表中计算变量以生成一个新变量。

enter image description here

由于原始数据比本示例大得多,我认为应使用“ for语句”或“ SQL”来完成此操作。

另一方面,我不知道如何准确地进行计算。

请让我知道。

谢谢。

P.S。这是我编写示例数据的代码。

install.packages("randomForestSRC")
library(randomForestSRC)

data(pbc)

dat <- na.omit(pbc)

n.dat <- dat[,5:8]

var <- c(names(n.dat))
OR <- c(1.45, 2.68, 1.11, 1.90)

m <- data.frame(var, OR)

1 个答案:

答案 0 :(得分:1)

您可以通过在R中使用dplyr包来解决此问题,可以使用以下代码

install.packages("dplyr")
library(dplyr)
m  <- m %>% mutate(newvar = ((sex*1.45)+(ascites*2.68)+(hempatom * 1.11)+(spider*1.90))
.

使用mutate函数,我们可以创建一个新列