我使用以下方式将人口普查ACS文件读入iPython Notebook:
pusb = pd.read_csv('ss14pusb.csv', low_memory=False, chunksize = 25000)
然后我选择了一些我想要保留并用于分析的列。现在我想将pusb
导出到txt或csv文件,但是`pusb.to_csv(等等......不起作用。我该怎么做?有没有办法连接我读过它们的块这样他们就是一个数据框架?
提前致谢!
答案 0 :(得分:0)
您可以尝试使用concat
函数:
pusb = pd.read_csv('ss14pusb.csv', low_memory=False, chunksize = 25000)
print pusb
#<pandas.io.parsers.TextFileReader object at 0x00000000150E0048>
df = pd.concat(tp, ignore_index=True)
我认为有必要为函数ignore index
添加参数concat
,因为避免了索引的重复性。
我尝试更好地解释一下:
pusb = pd.read_csv('ss14pusb.csv', low_memory=False, chunksize = 25000)
按块搜索csv
- docs,输出为TextFileReader
,而不是DataFrame
。
您可以通过以下方式检查此可迭代对象:
for chunk in pusb:
print(chunk)
然后,你需要concat
个大块DataFrame
- 使用concat
。