由于名称不完全相同,所以我在for循环中使用了grep(),我想要的是,将数据集中的每个公司都匹配到潜在列表,如果匹配的话,再加上它支付的钱。所以最后我想得到匹配的总付款。 但是当我使用该函数时,它返回我的pattern参数无效,希望有任何建议。以下是我的代码
for(j in 1:length(ReportedPayments[[1]])){
grep(ReportedPayments[[1]][j],DATA[[1]]$applicable_manufacturer_or_applicable_gpo_making_payment_name)
}
答案 0 :(得分:0)
我没有足够的声誉来添加评论,但是“名称不完全相同”是什么意思?
对于要在第二列中的公司名称(恰好)为潜在公司名称列表中的名称之一的所有行,您是否要查找第一列的总和?>
如果是这样,请尝试(使用数据集的名称):
library(tidyverse)
dataset %>%
filter(submitting_applicable_manufacturer_or_applicable_gpo_making_name %in% ReportedPayments[[1]]) %>%
summarise(total = sum(total_amount_of_payment_usdollars))