我的模式参数无效,如何解决

时间:2019-07-23 00:46:50

标签: r grep

我有一个数据集,其中包含公司名称和他们支付的钱。 enter image description here

我还有一个潜在的公司名称列表 enter image description here

由于名称不完全相同,所以我在for循环中使用了grep(),我想要的是,将数据集中的每个公司都匹配到潜在列表,如果匹配的话,再加上它支付的钱。所以最后我想得到匹配的总付款。 但是当我使用该函数时,它返回我的pattern参数无效,希望有任何建议。以下是我的代码

for(j in 1:length(ReportedPayments[[1]])){
    grep(ReportedPayments[[1]][j],DATA[[1]]$applicable_manufacturer_or_applicable_gpo_making_payment_name)
  }

1 个答案:

答案 0 :(得分:0)

我没有足够的声誉来添加评论,但是“名称不完全相同”是什么意思?

对于要在第二列中的公司名称(恰好)为潜在公司名称列表中的名称之一的所有行,您是否要查找第一列的总和?

如果是这样,请尝试(使用数据集的名称):

library(tidyverse)
dataset %>%
filter(submitting_applicable_manufacturer_or_applicable_gpo_making_name %in% ReportedPayments[[1]]) %>%
summarise(total = sum(total_amount_of_payment_usdollars))