我是SQL的新手。我有一个非常大的数据集,我查询,并尝试获取许多不同日期范围的行,并将这些行导出到Excel。数据集非常大,太大而无法加载到pandas中。我的问题是,有什么方法可以保存python中的查询结果,所以我可以在那个(小得多)的表上运行查询而不必从该数据集重新获取? (我加入和填充所以加载需要几分钟)
谢谢!
答案 0 :(得分:0)
理想情况下,我会请数据库管理员授予我在我自己的小模式中创建表的权限。
然后,我会去SELECT * FROM <whatever>
而不是沉重的CREATE TABLE my_stuff /* or a better name */ AS SELECT * FROM <whatever>
。
从那时起,你就拥有了一张较小的桌子,只要你需要就可以从中选择。
我想补充一点:只要你保持表格,你几乎可以做任何事情。通常情况下,#34;使用SQL在Excel中,在Vertica表中执行此操作。这也会快得多,因为它在数据库中运行。
如果你受到纪律处分,只要你不再需要它就再把它丢弃......
祝你好运 - 马可