我有两个数据集,如下所示。 (它是由示例数据制成的。)
现在,我想从两个表中计算变量以生成一个新变量。
由于原始数据比本示例大得多,我认为应使用“ for语句”或“ SQL”来完成此操作。
另一方面,我不知道如何准确地进行计算。
请让我知道。
谢谢。
P.S。这是我编写示例数据的代码。
install.packages("randomForestSRC")
library(randomForestSRC)
data(pbc)
dat <- na.omit(pbc)
n.dat <- dat[,5:8]
var <- c(names(n.dat))
OR <- c(1.45, 2.68, 1.11, 1.90)
m <- data.frame(var, OR)
答案 0 :(得分:1)
您可以通过在R中使用dplyr包来解决此问题,可以使用以下代码
install.packages("dplyr")
library(dplyr)
m <- m %>% mutate(newvar = ((sex*1.45)+(ascites*2.68)+(hempatom * 1.11)+(spider*1.90))
.
使用mutate函数,我们可以创建一个新列