Question

我有一个数据集，其中包含公司名称和他们支付的钱。

我还有一个潜在的公司名称列表

由于名称不完全相同，所以我在for循环中使用了grep（），我想要的是，将数据集中的每个公司都匹配到潜在列表，如果匹配的话，再加上它支付的钱。所以最后我想得到匹配的总付款。但是当我使用该函数时，它返回我的pattern参数无效，希望有任何建议。以下是我的代码

for(j in 1:length(ReportedPayments[[1]])){
    grep(ReportedPayments[[1]][j],DATA[[1]]$applicable_manufacturer_or_applicable_gpo_making_payment_name)
  }

Answer 1

我没有足够的声誉来添加评论，但是“名称不完全相同”是什么意思？

对于要在第二列中的公司名称（恰好）为潜在公司名称列表中的名称之一的所有行，您是否要查找第一列的总和？

如果是这样，请尝试（使用数据集的名称）：

library(tidyverse)
dataset %>%
filter(submitting_applicable_manufacturer_or_applicable_gpo_making_name %in% ReportedPayments[[1]]) %>%
summarise(total = sum(total_amount_of_payment_usdollars))

我的模式参数无效，如何解决

1 个答案: