如何将TextFileReader对象导出到txt

时间:2016-03-03 22:11:34

标签: python python-3.x pandas

我使用以下方式将人口普查ACS文件读入iPython Notebook:

pusb = pd.read_csv('ss14pusb.csv', low_memory=False, chunksize = 25000)

然后我选择了一些我想要保留并用于分析的列。现在我想将pusb导出到txt或csv文件,但是`pusb.to_csv(等等......不起作用。我该怎么做?有没有办法连接我读过它们的块这样他们就是一个数据框架?

提前致谢!

1 个答案:

答案 0 :(得分:0)

您可以尝试使用concat函数:

pusb = pd.read_csv('ss14pusb.csv', low_memory=False, chunksize = 25000)
print pusb
#<pandas.io.parsers.TextFileReader object at 0x00000000150E0048>
df = pd.concat(tp, ignore_index=True)

我认为有必要为函数ignore index添加参数concat,因为避免了索引的重复性。

我尝试更好地解释一下:

pusb = pd.read_csv('ss14pusb.csv', low_memory=False, chunksize = 25000)

按块搜索csv - docs,输出为TextFileReader,而不是DataFrame

您可以通过以下方式检查此可迭代对象:

for chunk in pusb:
    print(chunk)

然后,你需要concat个大块DataFrame - 使用concat

Concatenating objects