应用错误收集

在Python

时间：2017-06-11 00:25:04

标签： sql vertica

我是SQL的新手。我有一个非常大的数据集，我查询，并尝试获取许多不同日期范围的行，并将这些行导出到Excel。数据集非常大，太大而无法加载到pandas中。我的问题是，有什么方法可以保存python中的查询结果，所以我可以在那个（小得多）的表上运行查询而不必从该数据集重新获取？（我加入和填充所以加载需要几分钟）

谢谢！

1 个答案:

答案 0 :(得分：0)

理想情况下，我会请数据库管理员授予我在我自己的小模式中创建表的权限。

然后，我会去SELECT * FROM <whatever>而不是沉重的CREATE TABLE my_stuff /* or a better name */ AS SELECT * FROM <whatever>。

从那时起，你就拥有了一张较小的桌子，只要你需要就可以从中选择。

我想补充一点：只要你保持表格，你几乎可以做任何事情。通常情况下，＃34;使用SQL在Excel中，在Vertica表中执行此操作。这也会快得多，因为它在数据库中运行。

如果你受到纪律处分，只要你不再需要它就再把它丢弃......

祝你好运 - 马可