Question

dplyr函数通常具有令人难以置信的性能，并已通过开源R社区进行了优化，许多函数甚至在后台运行c++以使它们很多更快。

通过bigrquery和dbplyr生成的BigQuery代码是否得到了任何优化，还是只是生成了sql而未优化（却未优化）？（请注意，bigrquery和dbplyr（如dplyr也是tidyverse软件包，都是由dplyr作者Hadley Wickham创作的）

我对所生成的BigQuery代码的优化方式感兴趣，因为我试图确定是否值得进一步优化由 <{1}}和bigrquery编写的某些批处理过程em>手动 重写一些BigQuery代码（而不是使用这些软件包）。如果我不太可能看到显着的性能改进，我将不花时间进行改进。

dbplyr

Answer 1

这可能取决于您要优化的内容。例如。运行时或定价。

根据我的经验，专注于运行时：

但是，我在SQL Server而不是bigquery上使用dbplyr。因此，您必须判断它对您的上下文的泛化程度。