编写/格式化长r脚本的技巧?

时间:2019-06-13 02:25:14

标签: r

我有一个400行长的R脚本,可以执行各种数据导入和处理。这是一团糟,我想知道如何正确地组织它。我最好怎么去做?

我对R笔记本非常熟悉,但是为块添加额外的代码行(具有各种选项)会增加多余的代码。我正在寻找有关代码格式和布局的更多基本技巧。它不一定是R独有的。

2 个答案:

答案 0 :(得分:1)

即使多年后仍在为同一事物而苦苦挣扎的人的建议:

  1. 将每个主要部分拆分为一个单独的脚本(例如,加载,整理,分析,绘图,保存)。然后,主脚本只需按顺序调用它们(使用source('/path/to/script.r'))。
  2. 制作一个“制作数据”单独的脚本,该脚本读取和整理数据并将其保存为快速格式(我使用RDS)。然后,主脚本可以使用此RDS文件而不是凌乱的原始数据。
  3. 我认为笔记本更适合从已经处理的数据生成报告,而不是进行处理。
  4. 如果有很多重复的代码,请创建自己的函数。它们较难调试,但可以整理脚本。

答案 1 :(得分:1)

不确定是否使用过RProjects。可能会派上用场。

遇到类似问题后,我正在使用以下方法。

  1. 创建RProject
  2. 在该项目文件夹中创建以下文件夹

    • Data-所有输入数据都在这里。有时会有rawprocessed文件夹
    • Code-包含R个功能/代码段
    • Docs-项目的所有相关文档
    • Reports-从该项目中生成的任何报告。所有RMD,笔记本电脑都在这里。
    • Output-所有输出数据都在这里
  3. 任何重复的任务都将转换为函数并转到Functions.R文件,并放置在代码目录中

  4. 任何更大的函数或可以独立运行的函数(例如db连接)都作为单独的文件保存在Code文件夹中
  5. 所有版本的任务处理都位于主目录中,并将获取Functions.R文件和其他所需的文件