存储库中的大型测试数据集

时间:2013-06-03 18:19:09

标签: git testing repository

假设我正在开发一些开源软件,用解释语言编写,作为Git仓库管理,需要大量数据集(+300 MB)进行基本测试。

测试数据是否应该与源代码进入同一个存储库,并使用compileToZipFile.sh脚本发布版本?存储为两个单独的存储库, srcRepo testRepo 会更好吗?

任何最佳做法/惯例都将受到赞赏。

1 个答案:

答案 0 :(得分:1)

我认为这个问题的最佳答案是基于需要。

在我的工作中,我们按照环境类型隔离我们的代码/测试数据

  • 测试
  • QA
  • 分段
  • 生产

某些环境与生产具有相同的数据,而其他环境具有较旧(或完全不同)的数据。这样做的好处是:

  • 沙箱用于测试,实施和“玩”新的想法/技术。
  • 您不会影响面向客户的实时数据。
  • 集成测试可以满足/专注于与主代码库无关的某些方面。

现在,关于你的问题......正如我上面提到的,数据的隔离使我们能够快速进行更改并实现新功能,因为我们使用的数据主要关注我们正在测试的内容。我们有三个中继,它们都有独立的测试数据,这些数据特定于需要测试的内容。在测试View时,我们有一组测试,在测试Model时,我们有另一组测试,在测试Controller时,我们还有另一组测试。最后,我们有一组过度集成的集成测试,在新版本发布时运行。在所有情况下,除了最后一个,测试都与它们创建的组件一起存在;但同样,由于它们是集成测试,因此将它们与它们验证的三个部分分开保存是有道理的。

我认为你的想法很扎实。