标签: etl
我正在研究内部工具,该工具从多个来源加载数据并应用转换并将数据发布到网络。
我在将数据转换和发布到sql server时遇到了性能问题。
现在我们将中间数据存储在lucene中。这有关于更新的问题。
存储中间数据的其他替代方法是什么,必须快速且易于更新。
我们正在单线程中完成所有这些。我知道我们必须使用多个线程以获得更好的性能,但不以正确的方式处理线程会导致更多问题。所以我们使用单线程。