在“管道”中导入数据时,最佳实践是什么?

时间:2020-05-21 12:44:36

标签: r

假设我有某种过程,该过程从本地计算机上的CSV数据中获取数据。最终将需要通过某些cron作业安排此过程。我显然需要导入该数据,如果要编写自动脚本,则有两种主要解决方案。

  1. 创建一个用户定义的函数,该函数在主体中包含import语句。
    import_data_and_clean <- function(full_path){
         data = read_csv(path)
         ....
    }
  1. 创建一个dataset_builder.R文件,该文件不仅可以导入数据,还可以清理并准备数据以进行分析。
data = read_csv(path)
....

我的问题与在R中推荐使用哪种解决方案有关?

0 个答案:

没有答案