dplyr
函数通常具有令人难以置信的性能,并已通过开源R社区进行了优化,许多函数甚至在后台运行c++
以使它们很多更快。
通过bigrquery
和dbplyr
生成的BigQuery代码是否得到了任何优化,还是只是生成了sql而未优化(却未优化)? (请注意,bigrquery
和dbplyr
(如dplyr
也是tidyverse软件包,都是由dplyr作者Hadley Wickham创作的)
我对所生成的BigQuery代码的优化方式感兴趣,因为我试图确定是否值得进一步优化由 <{1}}和bigrquery
编写的某些批处理过程em>手动 重写一些BigQuery代码(而不是使用这些软件包)。如果我不太可能看到显着的性能改进,我将不花时间进行改进。
以下是来自the bigrquery
readme
dbplyr
答案 0 :(得分:0)
这可能取决于您要优化的内容。例如。运行时或定价。
根据我的经验,专注于运行时:
dbplyr
确实包括一些基本的查询优化from version 1.0.0 但是,我在SQL Server而不是bigquery上使用dbplyr
。因此,您必须判断它对您的上下文的泛化程度。