应用错误收集

我们一直在讨论在我们小组内设计数据仓库策略，以满足测试，可重复性和数据同步要求。建议的一个想法是使用existing tool来调整NoSQL方法，而不是尝试在文件系统上重新实现大量相同的方法。我不知道NoSQL方法是否是我们想要实现的目标的最佳方法，但也许如果我描述我们需要/希望你们所有人都可以提供帮助。

我们的大多数文件都是大型的，大小超过50个，以专有的第三方格式保存。我们需要能够通过名称/日期/源/时间/工件组合访问每个文件。基本上是键值对样式查找。
当我们查询文件时，我们不希望将所有文件加载到内存中。他们真的太大了，会淹没我们的服务器。我们希望能够以某种方式获取对该文件的引用，然后使用专有的第三方API来提取它的部分内容。
我们希望轻松添加，删除和导出存储中的文件。
我们想在两台服务器之间设置自动文件复制（我们可以为此编写一个脚本。）也就是说，将一台服务器的内容与另一台服务器同步。我们不需要一个分布式系统，它只显示我们有一台服务器。我们想要完全复制。
我们还有其他较小的文件与Big文件具有树型关系。一个文件的内容将指向下一个，依此类推，依此类推。它不是一个“辐条轮”，它是一棵完整的树。

我们更喜欢使用Python，C或C ++ API来处理这样的系统，但我们大多数人都有各种语言的经验。我们不介意只要它有效，完成工作，并节省我们的时间。你认为呢？有没有这样的东西？

NoSQL用于文件系统存储组织和复制？

3 个答案: