Question

我使用以下方式将人口普查ACS文件读入iPython Notebook：

pusb = pd.read_csv('ss14pusb.csv', low_memory=False, chunksize = 25000)

然后我选择了一些我想要保留并用于分析的列。现在我想将pusb导出到txt或csv文件，但是`pusb.to_csv（等等......不起作用。我该怎么做？有没有办法连接我读过它们的块这样他们就是一个数据框架？

提前致谢！

Answer 1

您可以尝试使用concat函数：

pusb = pd.read_csv('ss14pusb.csv', low_memory=False, chunksize = 25000)
print pusb
#<pandas.io.parsers.TextFileReader object at 0x00000000150E0048>
df = pd.concat(tp, ignore_index=True)

我认为有必要为函数ignore index添加参数concat，因为避免了索引的重复性。

我尝试更好地解释一下：

pusb = pd.read_csv('ss14pusb.csv', low_memory=False, chunksize = 25000)

按块搜索csv - docs，输出为TextFileReader，而不是DataFrame。

您可以通过以下方式检查此可迭代对象：

for chunk in pusb:
    print(chunk)

然后，你需要concat个大块DataFrame - 使用concat。

Concatenating objects

如何将TextFileReader对象导出到txt

1 个答案: